DATA CENTER

数据中心帮助文档和常见问题

2019-11-01

1、FAST数据中心集群参考文档:数据中心集群使用方法和PBS常用语法简介

2、数据中心集群登录VPN虚拟机镜像文件:  GW500m 

3、数据中心集群禁止了X转发并使用PBS提交作业,但可以使用VNC,设置参考文档:PBS环境中使用VNC

4、2020年7月用户培训文档:FAST高性能集群作业调度及集群使用介绍

 

数据中心常见问题:

1、发现集群登陆不上,出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic)

      (1) 确认自己是否修改过本机的公钥,造成集群上的公钥和集群公钥不匹配;

      (2) 确认自己是否修改过集群上自己用户主目录的权限,默认是700,如果改成其他的可能会造成无法登陆的情况。

2、已经授权读取了某个项目的数据,自己的用户账户(id username 查看)也已经在该附加组中,为何在读取时出任然现了Permission denied 的提示?

      解决方式: 查看自己用户账户所属的附加组(id username )个数是否已经超过了16个,因为NFS 文件系统的限制,用户所属附加组不能超过16个,如果已经超过16个,需要使用sg 命令,例如:sg - F3045 , 然后在ls /data31/3045 即可读取。

3、已经登录到mu01之后,执行了某些操作,然后出现了Resource temporarily unavailable 报错,然后就无法在登陆集群,登陆时会显示 No child processes 报错。

       这是因为我们集群使用PBS 作业调度,需要用户通过PBS 提交作业, 登陆节点mu01 不允许用户直接跑程序,或是打开类似IDL 等自己安装的软件包。我们在mu01设置了 限制用户使用的 nproc  (进程数) ,目前这个参数的设置是 24。如果你已经出现了这个问题,需要联系数据中心管理员杀死你在mu01上的进程。所以请不要直接在mu节点运行程序。

4、如何在FAST集群上使用GUI

         数据中心集群禁止了X转发并使用PBS提交作业,需要 GUI 操作的用户可以将受密码保护的 vncserver 作业提交到 cu_slim 队列(参考最上面的文档)。请务必设置VNC的密码,不然可能会将你的数据处理结果泄露给其他用户,请谨慎对待。

5、FAST原始观测数据解压缩

         数据中心对部分项目数据进行无损压缩,压缩为.xz或者.zst文件,解压缩命令参考如下:

xz -dc /path_1/file.xz > /path_2/file

zstd -dc /path_1/file.zst > /path_2/file

gzip -dc /path_1/file.gz > /path_2/file