Добрый день всем! Сразу же прошу прощения за простыню...
Пожалуйста помогите советом. Ситуация критическая по времени. Надеясь на Ваш ответ тем временем ищу по форума похожие проблемы, еще раз извините.На удаленном хосте установил Postgres и к стандартному по содержанию для solaris 8 файлу /etc/system добавил
set shmsys:shminfo_shmmax = 0x2000000
set shmsys:shminfo_shmmin = 1
set shmsys:shminfo_shmmni = 256
set shmsys:shminfo_shmseg = 256set semsys:seminfo_semmap = 256
set semsys:seminfo_semmni = 512
set semsys:seminfo_semmns = 512
set semsys:seminfo_semmsl = 32После этого выполнил команду reboot (знаю что лучше init 6)
В общем после reboot солярис отказывается выходить на номральное ssh соединение, т.е.
при попытке ssh remote-host на рута у которого стоит /bin/sh терминал пишет следющее:Sun Microsystems Inc. SunOS 5.8 Generic Patch February 2004
-sh: TERM=ansi: is not an identifierи зависает.
тем не менее осталась возможность выполнять команды через ssh remote-host -С "command". При попытке выполнить команду ssh remote-host -C "touch testfile" пишет что что мол файловая система недоступна для записи.
ssh remote-host -C "init 6" пробовал.
Спасибо за внимание!
>[оверквотинг удален]
>
>
>
> -sh: TERM=ansi: is not an identifier
>
>и зависает.
>
>тем не менее осталась возможность выполнять команды через ssh remote-host -С
>"command". При попытке выполнить команду ssh remote-host -C "touch testfile" пишет
>что что мол файловая система недоступна для записи.То что fs не доступна для записи настораживает.
Телнетом пробовал подключиться?Что за сервак?
Доступ к консоли сервера есть?
Судя по всему разрешить ситуацию можно будет только через консоль - ибо весь процесс загрузки выводится на консоль и ошибки в том числе.
>[оверквотинг удален]
>>что что мол файловая система недоступна для записи.
>
>То что fs не доступна для записи настораживает.
>Телнетом пробовал подключиться?
>
>Что за сервак?
>Доступ к консоли сервера есть?
>Судя по всему разрешить ситуацию можно будет только через консоль - ибо
>весь процесс загрузки выводится на консоль и ошибки в том числе.
>SinFire V240
К сожалению сервак в другом городе(Мурманская область, а я в Питере), адекватных людей рядом с ним не знаю, но даже если поехать к серверу, не знаю к чему быть готовым. До понедельника буду пытаться решить удаленно. Как я сказал возможность выполнить команду через ssh remote-host -C "command" есть.
Еще настораживает то что подобные операции уже были проделаны на 2-х серверах без проблем, а на двух других вот такая вот проблема.
>[оверквотинг удален]
>>что что мол файловая система недоступна для записи.
>
>То что fs не доступна для записи настораживает.
>Телнетом пробовал подключиться?
>
>Что за сервак?
>Доступ к консоли сервера есть?
>Судя по всему разрешить ситуацию можно будет только через консоль - ибо
>весь процесс загрузки выводится на консоль и ошибки в том числе.
>телнета нет.
Для других пользователей стоит шел - /bin/bash, на него коннектишся, терминал вообще без ответа.
>телнета нет.
>Для других пользователей стоит шел - /bin/bash, на него коннектишся, терминал вообще
>без ответа.То есть под другим пользователем зайти можно?
На 240-ом при случае обязательно надо настроить Net Managment Port - это консоль через ethernet, в курсе что это?
>>телнета нет.
>>Для других пользователей стоит шел - /bin/bash, на него коннектишся, терминал вообще
>>без ответа.
>
>То есть под другим пользователем зайти можно?
>
>На 240-ом при случае обязательно надо настроить Net Managment Port - это
>консоль через ethernet, в курсе что это?Нет. Я только хотел сказать что в системе есть несклько других логинов, но их шелл - баш, и войти в систему через эти логины тоже невозможно.
Да, представление имею, но на практике не пользовался. За подсказку - спасибо!
Есть преположения к чему быть готовым когда по консоли подключусь?
И пожалйста, очень прошу подсказки - я с линуксом знаком более или менее, иниты, драйвера, кернелы, бутстрапы и system V более менее знаю, с комп. Сетевые, а в особенности телефонные протоколы знаю очень хорошо, но с файловыми системами "на Вы" - глубоко не изучал - к чему быть готовым, особенно в солярке?
Кроме /etc/system что еще где нить менял?Возможно соляре не понравились значения в /etc/system - всякое может быть!
Если это действительно так то выход только один - из OBP (что бы попасть в OBP - init 0, или из ALOM команда break) дать команду boot -a (поищи инфу на сайте sun что за опция -а) и удалять добавленные строки строки из /etc/systemЕще можно загрузиться с CD в синглюзермод, в OBP - boot cdrom -s, подмонтировать рутовый раздел и далее...
Но это все предположения, полная картина только на консоли, а она не доступна.Если есть вопросы - задавай, постараюсь ответить.
Так торопился домой что забыл написать что если ты командой init 0 (или еще как) перейдешь в OBP то без консоли или Net Managment POrt тебе не обойтись! Сервак будет недоступен.
>Так торопился домой что забыл написать что если ты командой init 0
>(или еще как) перейдешь в OBP то без консоли или Net
>Managment POrt тебе не обойтись! Сервак будет недоступен.
>>После этого выполнил команду reboot (знаю что лучше init 6)По идее оно:
reboot performs a sync(1M) operation on the disks, and then a multi-user reboot is initiated. See init(1M) for details.Парень похоже готовил кернел к инсталяции чего то типа оракакеля и резво так понастроил SHM ... откуда взяты цЫфры - загадка сия есть (а оно оччень индивидуально и зело критично!), но похоже он испёк нестабильный кернель, ибо оно с одной стороны начинает ssh сессию и даже представляется ... а потом всё умирает.
Да пожалуй соглашусь - без консоли не обойтись. Я надеюсь ты оригинальный /etc/system сохранил? Певым делом вернуть. Потом смотреть на сколько памяти в коннкретно этой машине и какие устройства, парсить логи и ошибки из OBP. Не рокет саенс - но скучно не будет :)
>[оверквотинг удален]
>Парень похоже готовил кернел к инсталяции чего то типа оракакеля и резво
>так понастроил SHM ... откуда взяты цЫфры - загадка сия есть
>(а оно оччень индивидуально и зело критично!), но похоже он испёк
>нестабильный кернель, ибо оно с одной стороны начинает ssh сессию и
>даже представляется ... а потом всё умирает.
>
>Да пожалуй соглашусь - без консоли не обойтись. Я надеюсь ты оригинальный
>/etc/system сохранил? Певым делом вернуть. Потом смотреть на сколько памяти в
>коннкретно этой машине и какие устройства, парсить логи и ошибки из
>OBP. Не рокет саенс - но скучно не будет :)Оригинал /etc/system конечно сохранил, кернел не правил.
Догадки верные, понастроил SHM чтобы запустился postgres. При этом как я сказал на 2х серверах это прокатило, а на двух нет.В любом случае спасибо за информацию.
>[оверквотинг удален]
>>Да пожалуй соглашусь - без консоли не обойтись. Я надеюсь ты оригинальный
>>/etc/system сохранил? Певым делом вернуть. Потом смотреть на сколько памяти в
>>коннкретно этой машине и какие устройства, парсить логи и ошибки из
>>OBP. Не рокет саенс - но скучно не будет :)
>
>Оригинал /etc/system конечно сохранил, кернел не правил.
>Догадки верные, понастроил SHM чтобы запустился postgres. При этом как я сказал
>на 2х серверах это прокатило, а на двух нет.
>
>В любом случае спасибо за информацию.Пожалуйста кто знает солярис? Очень нужна помощь. С меня пивасик.
Вот добрался до сервера:
При загрузке с консоли выдает следующее:
Sun Fire V240, No Keyboard
Copyright 1998-2003 Sun Microsystems, Inc. All rights reserved.
OpenBoot 4.11.4, 2048 MB memory installed, Serial #60281267.
Ethernet address 0:3:ba:97:d1:b3, Host ID: 8397d1b3.Boot device: disk0:a File and args:
SunOS Release 5.8 Version Generic_108528-29 64-bit
Copyright 1983-2003 Sun Microsystems, Inc. All rights reserved.
Hardware watchdog enabled
CPU_FAN @ MB.P1.F0.RS has FAILED.SC Alert: CPU_FAN @ MB.P1.F0.RS has FAILED.
configuring IPv4 interfaces: bge0 bge1 bge2 bge3.
Hostname: sunhotline
mount: /dev/md/dsk/d10 is not this fstype.
/sbin/rcS: /etc/dfs/sharetab: cannot create
failed to open /etc/coreadm.confsyseventd: Unable to open daemon lock file '/etc
/sysevent/syseventd_lock': 'Read-only file system'The system is coming up. Plea
se wait.
/sbin/mountall: /tmp/sh900: cannot create
rm: Unable to remove directory /tmp: Read-only file system
mkdir: Failed to make directory "/tmp"; Read-only file system
chown: /tmp: Read-only file system
/etc/rc2.d/S69inet: /tmp/ifconfig.109: cannot create
grep: can't open /tmp/ifconfig.109
/etc/rc2.d/S69inet: test: argument expected
starting rpc services: rpcbind done.
Setting netmask of bge0 to 255.255.255.0
Setting netmask of bge1 to 255.255.255.0
Setting netmask of bge2 to 255.255.255.0
Setting netmask of bge3 to 255.255.255.0
Setting default IPv4 interface for multicast: add net 224.0/4: gateway sunhotlin
e
syslog service starting.
cron could not unlink FIFO: No such file or directory
cron aborted: cannot create fifo queue
! cannot create fifo queue oO eAI 24 13:44:20 2009
! ******* CRON ABORTED ******** oO eAI 24 13:44:20 2009
dumpadm: failed to open /etc/dumpadm.conf: Read-only file system
Print services started.
/usr/sbin/pmconfig: Can't open /etc/.cpr_config to update changes: Read-only fil
e system
/dev/bd.off: Read-only file system
mkdir: Read-only file system
Jun 24 13:44:21 sunhotline sendmail[217]: My unqualified host name (sunhotline)
unknown; sleeping for retry
volume management starting.
/etc/rc3.d/S15nfs.server: /tmp/sharetab.265: cannot create
touch: /tmp/sharetab.265 cannot create
mv: cannot access /tmp/sharetab.265
share_nfs: /home/excel/announcements: No such file or directory
share_nfs: /home/excel/records: No such file or directory
chmod: WARNING: can't change /etc/dfs/sharetab
Starting mysqld daemon with databases from /usr/local/mysql/var
/usr/local/mysql/bin/safe_mysqld: /usr/local/mysql/var/sunhotline.err: cannot cr
eate
The system is ready.sunhotline console login:
INIT: Command is respawning too rapidly. Check for possible errors.
id: sc "/usr/lib/saf/sac -t 300"
Jun 24 13:44:35 sunhotline mountd[289]: Cannot open /etc/dfs/sharetab: Read-only
file systemsunhotline console login: root
Password:
/etc/logindevperm: /dev/mouse: Read-only file system
/etc/logindevperm: /dev/kbd: Read-only file system
Last login: Wed Jun 24 13:36:35 on console
Jun 24 13:44:35 sunhotline last message repeated 7 times
Jun 24 13:44:47 sunhotline login: ROOT LOGIN /dev/console
Sun Microsystems Inc. SunOS 5.8 Generic Patch February 2004
-sh: TERM=ansi: is not an identifier
# bash
bash-2.03# rm /etc/system
rm: /etc/system: override protection 644 (yes/no)? yes
rm: /etc/system not removed: Read-only file system
bash-2.03#Как видно - удалить файл /etc/system или отредактировать его не получается. Как используя вход через консоль его подредактировать, думаю вся проблема именно в нем.
>>[оверквотинг удален]1)
>Jun 24 13:44:35 sunhotline mountd[289]: Cannot open /etc/dfs/sharetab: Read-only file system2)
>/etc/logindevperm: /dev/mouse: Read-only file system
>/etc/logindevperm: /dev/kbd: Read-only file system3)
>bash-2.03# rm /etc/system
>rm: /etc/system: override protection 644 (yes/no)? yes
>rm: /etc/system not removed: Read-only file systemА ты упорный :)
>Как видно - удалить файл /etc/system или отредактировать его не получается. Как
>используя вход через консоль его подредактировать, думаю вся проблема именно в нем.У тебя по каким то причинам / смонтировался как read-only. Перемонтируй.
>CPU_FAN @ MB.P1.F0.RS has FAILED.На материнке проблема с вентилятором на втором процике, если не изменяет память - ближний к морде сервера.
>mount: /dev/md/dsk/d10 is not this fstype.
Какая то проблема с рутовым диском в зеркале /dev/md/dsk/d10, если конечно d10 это рутовое зеркало.
Пришли плиз вывод команд OBP:
printenv и show-disksВ выводе этой команды интересует переменная boot_device
Если при инсталяции сервера все было сделано правильно, то должно быть что подобное:
boot_device <first_boot_device> <second_boot_device> ...<first_boot_device> <second_boot_device> - это будут nvaliase для
загрузочных дисков: рутовый диск и его зеркалоМожешь так же попробовать загрузиться самостоятельно:
boot <second_boot_device>если же у тебя будет только один дисковый boot_device,
то дай в OBP команду show-disks
Она покажет какие диски есть в системе и можно будет попробовать загрузиться с другого диска указав его путь:
boot /pciбла/бла/disk@N,M:aВместо N,M поставишь цифры из вывыода show-disks, буква "а" обозначает рутовый слайс диска.
Но если у тебя нет уверенности что все сделаешь правильно то лучше пришли
вывод команды OBP: printenv и show-disks
и я напишу тебе команды для загрузки с зеркала рутового диска.А вот есть проблема с файлом /etc/system или нет пока неизвестно, но вполне может быть что и нету ...
>Какая то проблема с рутовым диском в зеркале /dev/md/dsk/d10, если конечно d10
>это рутовое зеркало.Не правильно выразился - d10 рутовый слайс.
В целом поднять систему не проблема!
Так что не торопись переустанавливать ОС.
>[оверквотинг удален]
>Вместо N,M поставишь цифры из вывыода show-disks, буква "а" обозначает рутовый слайс
>диска.
>
>Но если у тебя нет уверенности что все сделаешь правильно то лучше
>пришли
>вывод команды OBP: printenv и show-disks
>и я напишу тебе команды для загрузки с зеркала рутового диска.
>
>А вот есть проблема с файлом /etc/system или нет пока неизвестно, но
>вполне может быть что и нету ...Ребята, спасибо что помогаете, а не пинаете! Большое спасибо!
К сожалению я не могу регулярно выходить в этот форум, так что извините за задержки в ответах.
Уже почитал немного про NVRAM и просесс загрузки сервера.
Вот данные которые я смог вытащить: сервера идеентичны в деталях, но один глючит, другой нет:На сервере который НЕ глючит команда mount выдает следующее:
bash-2.03# mount
/ on /dev/dsk/c1t0d0s0 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800000 on Tue Jun 9 13:47:17 2009
/usr on /dev/dsk/c1t0d0s5 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800005 on Tue Jun 9 13:47:18 2009
/proc on /proc read/write/setuid/dev=45c0000 on Tue Jun 9 13:47:17 2009
/dev/fd on fd read/write/setuid/dev=4680000 on Tue Jun 9 13:47:18 2009
/etc/mnttab on mnttab read/write/setuid/dev=4780000 on Tue Jun 9 13:47:19 2009
/var on /dev/dsk/c1t0d0s4 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800004 on Tue Jun 9 13:47:19 2009
/var/run on swap read/write/setuid/dev=1 on Tue Jun 9 13:47:19 2009
/tmp on swap read/write/setuid/dev=2 on Tue Jun 9 13:47:21 2009
/opt on /dev/dsk/c1t0d0s6 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800006 on Tue Jun 9 13:47:21 2009
/home on /dev/dsk/c1t0d0s7 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800007 on Tue Jun 9 13:47:21 2009
/home/excel/records on /dev/dsk/c1t1d0s6 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=80000e on Tue Jun 9 13:47:21 2009
На сервере который ГЛЮЧИТ команда mount выдает следующее
/ on /pci@1c,600000/scsi@2/disk@0,0:a read/write/setuid/dev=800000 on Wed Dec 31 21:00:00 1969
/usr on /dev/dsk/c0t0d0s6 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800006 on Fri Jun 26 12:50:23 2009
/proc on /proc read/write/setuid/dev=4b40000 on Fri Jun 26 12:50:22 2009
/dev/fd on fd read/write/setuid/dev=4c00000 on Fri Jun 26 12:50:24 2009
/etc/mnttab on mnttab read/write/setuid/dev=4cc0000 on Fri Jun 26 12:50:24 2009
/var on /dev/dsk/c0t0d0s1 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800001 on Fri Jun 26 12:50:25 2009
/var/run on swap read/write/setuid/dev=1 on Fri Jun 26 12:50:25 2009как видно творится какая то бойда с монтированием рутового раздела. От чего это происходит - даже не предпологаю.
И еще:
доступа к консольке нет, но тем, не менее я могу вам показать вывод команды eeprom:
на НЕ глючном сервере вывод следующий:
bash-2.03# eeprom
test-args: data not available.
diag-passes=1
asr-policy=normal
local-mac-address?=true
fcode-debug?=false
silent-mode?=false
scsi-initiator-id=7
oem-logo: data not available.
oem-logo?=false
oem-banner: data not available.
oem-banner?=false
ansi-terminal?=true
screen-#columns=80
screen-#rows=34
ttyb-rts-dtr-off=false
ttyb-ignore-cd=true
ttya-rts-dtr-off=false
ttya-ignore-cd=true
ttyb-mode=9600,8,n,1,-
ttya-mode=9600,8,n,1,-
output-device=ttya
input-device=ttya
auto-boot-on-error?=false
load-base=16384
auto-boot?=true
boot-command=boot
diag-file: data not available.
diag-device=net
boot-file: data not available.
boot-device=disk net
use-nvramrc?=false
nvramrc: data not available.
security-mode=none
security-password: data not available.
security-#badlogins=0
post-trigger=power-on-reset
diag-script=none
diag-level=max
diag-switch?=false
obdiag-trigger=power-on-reset
error-reset-recovery=bootНа ГЛЮЧНОМ сервере вывод eeprom такой:
bash-2.03# ssh 10.0.51.2 -C "eeprom"
root@10.0.51.2's password:
test-args: data not available.
diag-passes=1
asr-policy=normal
local-mac-address?=true
fcode-debug?=false
silent-mode?=false
scsi-initiator-id=7
oem-logo: data not available.
oem-logo?=false
oem-banner: data not available.
oem-banner?=false
ansi-terminal?=true
screen-#columns=80
screen-#rows=34
ttyb-rts-dtr-off=false
ttyb-ignore-cd=true
ttya-rts-dtr-off=false
ttya-ignore-cd=true
ttyb-mode=9600,8,n,1,-
ttya-mode=9600,8,n,1,-
output-device=ttya
input-device=ttya
auto-boot-on-error?=false
load-base=16384
auto-boot?=true
boot-command=boot
diag-file: data not available.
diag-device=disk0
boot-file: data not available.
boot-device=disk0
use-nvramrc?=false
nvramrc: data not available.
security-mode=none
security-password: data not available.
security-#badlogins=0
post-trigger=power-on-reset
diag-script=none
diag-level=min
diag-switch?=false
obdiag-trigger=power-on-reset
error-reset-recovery=bootкак видно boot-device какой то непонятный у нормального сервера там два девайса, а у ГЛЮЧНОГО один и при этом он disk0
как я понял через команду eeprom можно поменять все те параметры которые ты уже упомниал.
про команду eeprom узнал вот по этой ссылке
http://www.sunmanagers.org/archives/1998/1203.html
>про команду eeprom узнал вот по этой ссылке
>http://www.sunmanagers.org/archives/1998/1203.htmlТак! слушай, есть вопрос!
Я как то совсем забыл о том что при зеркалировании дисков с помощью metadevice
в /etc/system должны быть строки:* Begin MDD root info (do not edit)
rootdev:/pseudo/md@0:0,0,blk
* End MDD root info (do not edit)пришли ка, полный листинг /etc/system и /etc/vfstab
>[оверквотинг удален]
>Так! слушай, есть вопрос!
>Я как то совсем забыл о том что при зеркалировании дисков с
>помощью metadevice
>в /etc/system должны быть строки:
>
>* Begin MDD root info (do not edit)
>rootdev:/pseudo/md@0:0,0,blk
>* End MDD root info (do not edit)
>
>пришли ка, полный листинг /etc/system и /etc/vfstabЭто текущий листинг /etc/system с ГЮЧНОГО сервера.
*ident "@(#)system 1.18 97/06/27 SMI" /* SVR4 1.5 */
*
* SYSTEM SPECIFICATION FILE
** moddir:
*
* Set the search path for modules. This has a format similar to the
* csh path variable. If the module isn't found in the first directory
* it tries the second and so on. The default is /kernel /usr/kernel
*
* Example:
* moddir: /kernel /usr/kernel /other/modules* root device and root filesystem configuration:
*
* The following may be used to override the defaults provided by
* the boot program:
*
* rootfs: Set the filesystem type of the root.
*
* rootdev: Set the root device. This should be a fully
* expanded physical pathname. The default is the
* physical pathname of the device where the boot
* program resides. The physical pathname is
* highly platform and configuration dependent.
*
* Example:
* rootfs:ufs
* rootdev:/sbus@1,f8000000/esp@0,800000/sd@3,0:a
*
* (Swap device configuration should be specified in /etc/vfstab.)* exclude:
*
* Modules appearing in the moddir path which are NOT to be loaded,
* even if referenced. Note that `exclude' accepts either a module name,
* or a filename which includes the directory.
*
* Examples:
* exclude: win
* exclude: sys/shmsys* forceload:
*
* Cause these modules to be loaded at boot time, (just before mounting
* the root filesystem) rather than at first reference. Note that
* forceload expects a filename which includes the directory. Also
* note that loading a module does not necessarily imply that it will
* be installed.
*
* Example:
* forceload: drv/foo* set:
*
* Set an integer variable in the kernel or a module to a new value.
* This facility should be used with caution. See system(4).
*
* Examples:
*
* To set variables in 'unix':
*
* set nautopush=32
* set maxusers=40
*
* To set a variable named 'debug' in the module named 'test_module'
*
* set test_module:debug = 0x13
*set shmsys:shminfo_shmmax = 0x2000000
set shmsys:shminfo_shmmin = 1
set shmsys:shminfo_shmmni = 256
set shmsys:shminfo_shmseg = 256set semsys:seminfo_semmap = 256
set semsys:seminfo_semmni = 512
set semsys:seminfo_semmns = 512
set semsys:seminfo_semmsl = 32Это оригинальный листинг /etc/system.orig с Глючного сервера.
*ident "@(#)system 1.18 97/06/27 SMI" /* SVR4 1.5 */
*
* SYSTEM SPECIFICATION FILE
** moddir:
*
* Set the search path for modules. This has a format similar to the
* csh path variable. If the module isn't found in the first directory
* it tries the second and so on. The default is /kernel /usr/kernel
*
* Example:
* moddir: /kernel /usr/kernel /other/modules* root device and root filesystem configuration:
*
* The following may be used to override the defaults provided by
* the boot program:
*
* rootfs: Set the filesystem type of the root.
*
* rootdev: Set the root device. This should be a fully
* expanded physical pathname. The default is the
* physical pathname of the device where the boot
* program resides. The physical pathname is
* highly platform and configuration dependent.
*
* Example:
* rootfs:ufs
* rootdev:/sbus@1,f8000000/esp@0,800000/sd@3,0:a
*
* (Swap device configuration should be specified in /etc/vfstab.)* exclude:
*
* Modules appearing in the moddir path which are NOT to be loaded,
* even if referenced. Note that `exclude' accepts either a module name,
* or a filename which includes the directory.
*
* Examples:
* exclude: win
* exclude: sys/shmsys* forceload:
*
* Cause these modules to be loaded at boot time, (just before mounting
* the root filesystem) rather than at first reference. Note that
* forceload expects a filename which includes the directory. Also
* note that loading a module does not necessarily imply that it will
* be installed.
*
* Example:
* forceload: drv/foo* set:
*
* Set an integer variable in the kernel or a module to a new value.
* This facility should be used with caution. See system(4).
*
* Examples:
*
* To set variables in 'unix':
*
* set nautopush=32
* set maxusers=40
*
* To set a variable named 'debug' in the module named 'test_module'
*
* set test_module:debug = 0x13* Begin MDD root info (do not edit)
forceload: misc/md_trans
forceload: misc/md_raid
forceload: misc/md_hotspares
forceload: misc/md_sp
forceload: misc/md_stripe
forceload: misc/md_mirror
forceload: drv/pcisch
forceload: drv/glm
forceload: drv/sd
rootdev:/pseudo/md@0:0,10,blk
* End MDD root info (do not edit)
* Begin MDD database info (do not edit)
set md:mddb_bootlist1="sd:5:16 sd:5:1050 sd:5:2084 sd:13:16 sd:13:1050"
set md:mddb_bootlist2="sd:13:2084"
* End MDD database info (do not edit)файла /etc/vfstab пишет что не существует.
Открылись новые подробности, оказывается правилный вывод mount должен быть таким:
/ on /pci@1c,600000/scsi@2/disk@0,0:a read/write/setuid/dev=800000 on Wed Dec 31 21:00:00 1969
/usr on /dev/dsk/c0t0d0s6 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800006 on Mon Jun 29 13:23:55 2009
/proc on /proc read/write/setuid/dev=4b40000 on Mon Jun 29 13:23:54 2009
/dev/fd on fd read/write/setuid/dev=4c00000 on Mon Jun 29 13:23:55 2009
/etc/mnttab on mnttab read/write/setuid/dev=4cc0000 on Mon Jun 29 13:23:56 2009
/var on /dev/dsk/c0t0d0s1 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800001 on Mon Jun 29 13:23:56 2009
/var/run on swap read/write/setuid/dev=1 on Mon Jun 29 13:23:56 2009
/var/point on /dev/md/dsk/d10 read/write/setuid/intr/largefiles/onerror=panic/dev=154000a on Mon Jun 29 13:39:42 2009
последовательностью команд:ssh server-ip -C "mkdir /var/point"
ssh server-ip -C "mount /dev/md/dsk/d10 /var/point"удалось примонтировать зеркало и получить доступ к файлу /var/point/etc/system т.е. я могу его через sftp выгрузить отредактировать и загрузить обратно, а с консолью мне помогут удаленно.
Остался вопрос почему после загрузки у меня вместо
/ on /dev/dsk/c1t0d0s0 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800000 on Tue Jun 9 13:47:17 2009
получается
/ on /pci@1c,600000/scsi@2/disk@0,0:a read/write/setuid/dev=800000 on Wed Dec 31 21:00:00 1969
видимо поэтому и на запись не дается.
в предыдущем сообщении ошибка!
правильный вывод команды mount должен быть вот таким:
/ on /dev/dsk/c1t0d0s0 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800000 on Tue Jun 9 13:47:17 2009
/usr on /dev/dsk/c1t0d0s5 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800005 on Tue Jun 9 13:47:18 2009
/proc on /proc read/write/setuid/dev=45c0000 on Tue Jun 9 13:47:17 2009
/dev/fd on fd read/write/setuid/dev=4680000 on Tue Jun 9 13:47:18 2009
/etc/mnttab on mnttab read/write/setuid/dev=4780000 on Tue Jun 9 13:47:19 2009
/var on /dev/dsk/c1t0d0s4 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800004 on Tue Jun 9 13:47:19 2009
/var/run on swap read/write/setuid/dev=1 on Tue Jun 9 13:47:19 2009
/tmp on swap read/write/setuid/dev=2 on Tue Jun 9 13:47:21 2009
/opt on /dev/dsk/c1t0d0s6 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800006 on Tue Jun 9 13:47:21 2009
/home on /dev/dsk/c1t0d0s7 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800007 on Tue Jun 9 13:47:21 2009
/home/excel/records on /dev/dsk/c1t1d0s6 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=80000e on Tue Jun 9 13:47:21 2009
все нормально vfstab существует, я пытался посмотреть vfstablebash-2.03# cat /var/point/etc/vfstab
#device device mount FS fsck mount mount
#to mount to fsck point type pass at boot options
#
#/dev/dsk/c1d0s2 /dev/rdsk/c1d0s2 /usr ufs 1 yes -
fd - /dev/fd fd - no -
/proc - /proc proc - no -
/dev/dsk/c1t0d0s1 - - swap - no -
/dev/dsk/c1t0d0s0 /dev/rdsk/c1t0d0s0 / ufs 1 no logging
/dev/dsk/c1t0d0s5 /dev/rdsk/c1t0d0s5 /usr ufs 1 no logging
/dev/dsk/c1t0d0s4 /dev/rdsk/c1t0d0s4 /var ufs 1 no logging
/dev/dsk/c1t0d0s6 /dev/rdsk/c1t0d0s6 /opt ufs 2 yes logging
swap - /tmp tmpfs - yes -
#
# Spare space
#
/dev/dsk/c1t0d0s7 /dev/rdsk/c1t0d0s7 /home ufs 3 yes logging
/dev/dsk/c1t1d0s6 /dev/rdsk/c1t1d0s6 /home/excel/records ufs 2 yes logging
Привет!>как видно творится какая то бойда с монтированием рутового раздела. От чего это происходит - даже не предпологаю.
Это у тебя проблема с диском /pci@1c,600000/scsi@2/disk@0,0:a , но он у тебя зазеркален,
судя по твоему предыдущему посту.
d10 - зеркало, пришли вывод команды metastat d10 со сбойного сервера.
Плюс пришли вывод комнды ls -la /dev/dskЭто нам поможет выяснить какой диск является submirror.
>как видно boot-device какой то непонятный у нормального сервера там два девайса,
>а у ГЛЮЧНОГО один и при этом он disk0Это не важно disk0 это devalias на первый диск, net - сетевой устройство.
Так что это не проблема.
Плохо другое - рутовый диск зазеркалировали, но OBP не создали nvalias для возможности загрузки со второго диска.>
>как я понял через команду eeprom можно поменять все те параметры которые
>ты уже упомниал.совершенно верно.
Можно через eeprom попробовать загрузиться со второго диска, зеркало рутового.
Дай команду - eeprom "use-nvramrc?=true" - это даст нам возможность создать nvalias для
submirror диска и использовать созданный nvalias для загрузки ОС.После того как пришлешь вывод команд metastat d10 и ls -la /dev/dsk
попробуем соорудить в OBP nvalias для второго загрузочного диска и загрузиться с него.Но!!!
Без доступа к консоли мы очень сильно ограничены в своих возможностях!
Доступ нужен как воздух.А на данный момент тебе надо искать замену вентилятору на втором процике.
Это вентилятор довольно специфичный!
Так же скорей всего придется менять и диск.
>[оверквотинг удален]
>него.
>
>Но!!!
>Без доступа к консоли мы очень сильно ограничены в своих возможностях!
>Доступ нужен как воздух.
>
>А на данный момент тебе надо искать замену вентилятору на втором процике.
>
>Это вентилятор довольно специфичный!
>Так же скорей всего придется менять и диск.Как написал выше с зеркалом вроде бы все нормально
вот вывод команд:
metastat d10
d10: Mirror
Submirror 0: d11
State: Okay
Submirror 1: d12
State: Okay
Pass: 1
Read option: roundrobin (default)
Write option: parallel (default)
Size: 1058304 blocksd11: Submirror of d10
State: Okay
Size: 1058304 blocks
Stripe 0:
Device Start Block Dbase State Hot Spare
c0t0d0s0 0 No Okay
d12: Submirror of d10
State: Okay
Size: 1058304 blocks
Stripe 0:
Device Start Block Dbase State Hot Spare
c0t1d0s0 0 No Okayls -la /dev/dsk
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t0d0s0 -> ../../devices/pci@1c,600000/scsi@2/sd@0,0:a
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t0d0s1 -> ../../devices/pci@1c,600000/scsi@2/sd@0,0:b
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t0d0s2 -> ../../devices/pci@1c,600000/scsi@2/sd@0,0:c
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t0d0s3 -> ../../devices/pci@1c,600000/scsi@2/sd@0,0:d
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t0d0s4 -> ../../devices/pci@1c,600000/scsi@2/sd@0,0:e
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t0d0s5 -> ../../devices/pci@1c,600000/scsi@2/sd@0,0:f
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t0d0s6 -> ../../devices/pci@1c,600000/scsi@2/sd@0,0:g
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t0d0s7 -> ../../devices/pci@1c,600000/scsi@2/sd@0,0:h
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s0 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:a
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s1 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:b
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s2 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:c
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s3 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:d
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s4 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:e
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s5 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:f
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s6 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:g
lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s7 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:h
Судя по всему проблема в том что при загрузке вместо того чтобы к корню примонтировать d10 монтируется только одна часть зеркала.
Привет!>mount: /dev/md/dsk/d10 is not this fstype.
>все нормально vfstab существует, я пытался посмотреть vfstablebash-2.03# cat /var/point/etc/vfstab
#device device mount FS fsck mount mount
#to mount to fsck point type pass at boot options
#
#/dev/dsk/c1d0s2 /dev/rdsk/c1d0s2 /usr ufs 1 yes -
fd - /dev/fd fd - no -
/proc - /proc proc - no -
/dev/dsk/c1t0d0s1 - - swap - no -
/dev/dsk/c1t0d0s0 /dev/rdsk/c1t0d0s0 / ufs 1 no logging
/dev/dsk/c1t0d0s5 /dev/rdsk/c1t0d0s5 /usr ufs 1 no logging
/dev/dsk/c1t0d0s4 /dev/rdsk/c1t0d0s4 /var ufs 1 no logging
/dev/dsk/c1t0d0s6 /dev/rdsk/c1t0d0s6 /opt ufs 2 yes logging
swap - /tmp tmpfs - yes -
#
# Spare space
#
/dev/dsk/c1t0d0s7 /dev/rdsk/c1t0d0s7 /home ufs 3 yes logging
/dev/dsk/c1t1d0s6 /dev/rdsk/c1t1d0s6 /home/excel/records ufs 2 yes loggingмне кажется что это vfstab не с глючного сервера...
потому что в этом vfstab'е диск c1t0d0, в выводе команд metastat и ls
у тебя c0t0d0 и c0t1d0.
Проверь плиз.
>[оверквотинг удален]
>lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s0 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:a
>lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s1 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:b
>lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s2 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:c
>lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s3 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:d
>lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s4 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:e
>lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s5 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:f
>lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s6 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:g
>lrwxrwxrwx 1 root root 43 Nov 22 2004 c0t1d0s7 -> ../../devices/pci@1c,600000/scsi@2/sd@1,0:h
>
>теперь что касается загрузки со втрого диска:
eeprom "boot-device=/pci@1c,600000/scsi@2/disk@1,0:a /pci@1c,600000/scsi@2/disk@0,0:a"
После этой команды сервера будет использовать для загрузки диск c0t1d0s0НО!!! Не торопись ее использовать, сначала надо окончательно разобраться с /etc/vfstab !!!
Подмонтируй c0t1d0s0 в /tmp/a (в /tmp можно писать) и посмотри содержимое файлов /etc/system и /etc/vfstab на нем.
Если в нем будет строки с метадевайсами (/dev/md/dsk/d10) - значит точно ты показал /etc/vfstab не с того сервера.>Судя по всему проблема в том что при загрузке вместо того чтобы
>к корню примонтировать d10 монтируется только одна часть зеркала.До этого дело не доходит. Что бы смонтировать зеркало нужно загрузить модули в ядро, а у тебя в /etc/system они не указаны.
Давай, уточняй /etc/vfstab
вот вывод команды ssh server-ip -C "cat /etc/vfstab"#device device mount FS fsck mount mount
#to mount to fsck point type pass at boot options
#
#/dev/dsk/c1d0s2 /dev/rdsk/c1d0s2 /usr ufs 1 yes -
fd - /dev/fd fd - no -
/proc - /proc proc - no -
/dev/dsk/c0t0d0s3 - - swap - no -
/dev/md/dsk/d10 /dev/md/rdsk/d10 / ufs 1 no logging
/dev/dsk/c0t0d0s6 /dev/rdsk/c0t0d0s6 /usr ufs 1 no logging
/dev/dsk/c0t0d0s1 /dev/rdsk/c0t0d0s1 /var ufs 1 no logging
/dev/dsk/c0t0d0s7 /dev/rdsk/c0t0d0s7 /usr/home ufs 2 yes logging
/dev/dsk/c0t1d0s6 /dev/rdsk/c0t1d0s6 /home/excel/records ufs 2 yes logging
swap - /tmp tmpfs - yes -
вот вывод команды ssh server-ip -C "metastat d10"
d10: Mirror
Submirror 0: d11
State: Okay
Submirror 1: d12
State: Okay
Pass: 1
Read option: roundrobin (default)
Write option: parallel (default)
Size: 1058304 blocksd11: Submirror of d10
State: Okay
Size: 1058304 blocks
Stripe 0:
Device Start Block Dbase State Hot Spare
c0t0d0s0 0 No Okay
d12: Submirror of d10
State: Okay
Size: 1058304 blocks
Stripe 0:
Device Start Block Dbase State Hot Spare
c0t1d0s0 0 No Okayвот вывод команды ssh server-ip -C "mount /dev/rdsk/c0t1d0s0 /tmp/a"
mount: /dev/rdsk/c0t1d0s0 not a block device
вот вывод команды ssh server-ip -C "cat /var/point/etc/vfstab" после выполнения команды ssh server-ip "mount /dev/md/dsk/d10 /var/point"#device device mount FS fsck mount mount
#to mount to fsck point type pass at boot options
#
#/dev/dsk/c1d0s2 /dev/rdsk/c1d0s2 /usr ufs 1 yes -
fd - /dev/fd fd - no -
/proc - /proc proc - no -
/dev/dsk/c0t0d0s3 - - swap - no -
/dev/md/dsk/d10 /dev/md/rdsk/d10 / ufs 1 no logging
/dev/dsk/c0t0d0s6 /dev/rdsk/c0t0d0s6 /usr ufs 1 no logging
/dev/dsk/c0t0d0s1 /dev/rdsk/c0t0d0s1 /var ufs 1 no logging
/dev/dsk/c0t0d0s7 /dev/rdsk/c0t0d0s7 /usr/home ufs 2 yes logging
/dev/dsk/c0t1d0s6 /dev/rdsk/c0t1d0s6 /home/excel/records ufs 2 yes logging
swap - /tmp tmpfs - yes -
вот вывод команды ssh server-ip -C "mount"
/ on /pci@1c,600000/scsi@2/disk@0,0:a read/write/setuid/dev=800000 on Wed Dec 31 21:00:00 1969
/usr on /dev/dsk/c0t0d0s6 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800006 on Mon Jun 29 17:26:46 2009
/proc on /proc read/write/setuid/dev=4b40000 on Mon Jun 29 17:26:45 2009
/dev/fd on fd read/write/setuid/dev=4c00000 on Mon Jun 29 17:26:46 2009
/etc/mnttab on mnttab read/write/setuid/dev=4cc0000 on Mon Jun 29 17:26:47 2009
/var on /dev/dsk/c0t0d0s1 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800001 on Mon Jun 29 17:26:48 2009
/var/run on swap read/write/setuid/dev=1 on Mon Jun 29 17:26:48 2009
/tmp on swap read/write/setuid/dev=2 on Mon Jun 29 17:33:42 2009
/usr/home on /dev/dsk/c0t0d0s7 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=800007 on Mon Jun 29 17:33:42 2009
/usr/home/excel/records on /dev/dsk/c0t1d0s6 read/write/setuid/intr/largefiles/logging/onerror=panic/dev=80000e on Mon Jun 29 17:33:42 2009
/var/point on /dev/md/dsk/d10 read/write/setuid/intr/largefiles/onerror=panic/dev=154000a on Mon Jun 29 17:42:34 2009
!!!SOLVED!!!Маленькое вступление.
Есть сеть из 10 серверов, как я предпологал все идеинтичны. Но! Как оказалось два из них запущены без md. В этом то я и ошибался. Запустив постгрес на сервере без зеркала, я, из лени, скопировал вместе с дистирбутивом постгреса и файл /etc/system (с поправленным shmax) на другие, в том числе и на те на которых зеркала есть. Соответственно после подстановки "неправильного" файла /etc/system, в котором нет команд подгрузки модулей рейда. После перезагрузки вместо того чтобы примонитровать к / md, система монировала только один диск и система отказалась впускать меня через ssh. Причина - видимо при входе через ssh, где то на диске нужно сделать служебную запись sh или bash, и терминал - "подвисал".
Как я решил проблему:
1. ssh server-ip -C "mkdir /tmp/a"
2. ssh server-ip -C "mount /dev/md/dsk/d10 /tmp/a"
3. ssh server-ip -C "mv /tmp/a/etc/system.orig /tmp/a/etc/system"
4. ssh server-ip -C "reboot"После этого все стало ок. Удачно вручную добавил в /etc/system необходимые мне настройки памяти и перезагрузил - все заработало, постгрес запустился.
Serge_jar, ты мне очень помог разобраться в ситуации и думать в нужном направлении, говори где и как тебя отблагодарить. Я в Питере.Всем остальным тоже спасибо, как минимум за моральную поддержку.
Ребята - удачи!
привет!Ну что ж! Прими мои поздравления!
Я в Москве.
По поводу благодарности: достаточно твоего спасибо. 8-)))И еще пару советов: очень неплохо поставить сервера на поддержку в sun microsystem. Это стоит денег, но найти некоторые запчасти иногда весьма непросто! Это то что касается запчастей, так же имея техподдержку твоя проблема была бы еще и проблемой sun microsystem и они решали бы ее вместе с тобой. Причем в основном они, и выезд в Мурманск, или куда еще, их проблема и все, все, все ... На выходе ты получишь рабочий сервер.
Другой совет опять же про консоль, при случае обязательно организуй доступ. Ты сам убедился
что значит отсутствие доступа и работа на ощупь, не видя ошибок, не зная куда копать.Проверь лог ошибок ALOM'а на сервера - похоже что сдох один из вентиляторов на втором проце.
Удачи!
>[оверквотинг удален]
>>Да пожалуй соглашусь - без консоли не обойтись. Я надеюсь ты оригинальный
>>/etc/system сохранил? Певым делом вернуть. Потом смотреть на сколько памяти в
>>коннкретно этой машине и какие устройства, парсить логи и ошибки из
>>OBP. Не рокет саенс - но скучно не будет :)
>
>Оригинал /etc/system конечно сохранил, кернел не правил.
>Догадки верные, понастроил SHM чтобы запустился postgres. При этом как я сказал
>на 2х серверах это прокатило, а на двух нет.
>
>В любом случае спасибо за информацию.После boot -a указал на сохраненный оригинальный /etc/system.orig - на результат не повлияло.
Скажите а solaris 8 с нуля - реально установить?
>>[оверквотинг удален]
>Скажите а solaris 8 с нуля - реально установить?Не пори горячку!
У тебя есть все шансы ее восстановить без экстима ...Но! Если _уже_ ушатал систему до состояния незагрузки из OBP ...
В общем даю гениальный ответ: solaris 8 с нуля - установить реально :)