2022年5月17日 星期二

安裝GRID execution HOST出現 sge_shepherd won't run -- dynamic library missing?

 安裝GRID execution HOST出現以下錯誤


Grid Engine execution daemon startup

------------------------------------

Starting execution daemon. Please wait ...

sge_shepherd won't run -- dynamic library missing?


Hit <RETURN> to continue >>


解法: 

在那台Linux設備安裝hwloc後再重新安裝GRID execution HOST



2021年9月2日 星期四

進行finesim2017/finesim2018的模擬驗證時會出現以下的arguments to sbus_move_error() were incorrect錯誤訊息

進行finesim2017/finesim2018的模擬驗證時出現以下的arguments to sbus_move_error() were incorrect錯誤訊息(點圖可以看的比較清楚)



解法:就是把執行finesim2017/finesim2018的那台設備重開即可

GRID System在使用者Submit Job時出現No such file or directory的錯誤訊息

qrsh_starter: cannot write pid file /tmp/1095451.1.lay.q/pid: No such file or directory

qrsh_starter: cannot open file /tmp/1095451.1.lay.q/qrsh_error: No such file or directory

qrsh_starter: cannot open file /tmp/1095451.1.lay.q/qrsh_exit_code: No such file or directory

qrsh_starter: cannot open file /tmp/1095451.1.lay.q/qrsh_error: No such file or directory



試出的解法就是將GRID System的Master Server重開




Linux視窗系統中的gnome-panel(面版)不見了

Linux視窗系統中的gnome-panel(面版)不見了,最快的方式就是恢復成預設值。方法說明如下


gconftool-2 --shutdown

rm -rf ~/.gconf/apps/panel

pkill gnome-panel



資訊來源  http://playubuntu.blogspot.com/2010/05/gnome-panel.html

2018年6月26日 星期二

在hostB安裝execution host出現error: commlib error: access denied錯誤

hostSG是GRID系統的Master Host,而hostB則是預計要安裝execution host的設備

安裝方式是使用root帳號在$SGE_ROOT路徑下執行.\inst_sge -x

安裝的過程中出現的錯誤訊息如下:

Checking hostname resolving
---------------------------

Cannot contact qmaster. The command failed:

   ./bin/lx24-amd64/qconf -sh

The error message was:

   error: commlib error: access denied (client IP resolved to host name "hostA". This is not identical to clients host name "hostB")
ERROR: unable to contact qmaster using port 5536 on host "hostSG"

You can fix the problem now or abort the installation  procedure.
The problem can be:

   - the qmaster is not running
   - the qmaster host is down
   - an active firewall blocks your request

解法:
將hostSG的/etc/hosts檔案內容中的 "192.168.1.100 hostA"設定移除即可排除
hostA是工作站網路中不存在的設備名稱