URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID9
Нить номер: 8773
[ Назад ]

Исходное сообщение
"SED для удаление ссылок из html-файла"

Отправлено realovich , 14-Июн-10 09:27 
Доброе время суток, знатоки!
У меня к вам вопрос:
как с помощью sed или других подобных инструментов удалить ссылки из html-документа.
То есть, мне нужно почистить документ от ссылок типа:
<a class="bla1-bla2-bla3" href="bla4-bla5-bla6">Ссылка</a>
и:
<a href="bla4-bla5-bla6">Ссылка</a>
Но содержимое тега оставить, то есть, грубо говоря, чтобы слово "Ссылка" - осталось.
Заранее премного благодарен!

Содержание

Сообщения в этом обсуждении
"SED для удаление ссылок из html-файла"
Отправлено realovich , 14-Июн-10 10:59 
забыл указать важный момент, что ссылка находится не на одной строке... А примерно так:
<a class="bla1-bla2-bla3"
href="bla4-bla5-bla6">Ссылка</a>


"SED для удаление ссылок из html-файла"
Отправлено realovich , 14-Июн-10 15:45 
Не дождался ответа, нашел, более или менее устраивающий меня вариант. Убирает непосредственно ссылку. Тег "a" остается, чтобы не выводился класс.

cat file0.htm | sed 's#href=\"?[^",]*\"##' > file1.htm