Доброе время суток, знатоки!
У меня к вам вопрос:
как с помощью sed или других подобных инструментов удалить ссылки из html-документа.
То есть, мне нужно почистить документ от ссылок типа:
<a class="bla1-bla2-bla3" href="bla4-bla5-bla6">Ссылка</a>
и:
<a href="bla4-bla5-bla6">Ссылка</a>
Но содержимое тега оставить, то есть, грубо говоря, чтобы слово "Ссылка" - осталось.
Заранее премного благодарен!
забыл указать важный момент, что ссылка находится не на одной строке... А примерно так:
<a class="bla1-bla2-bla3"
href="bla4-bla5-bla6">Ссылка</a>
Не дождался ответа, нашел, более или менее устраивающий меня вариант. Убирает непосредственно ссылку. Тег "a" остается, чтобы не выводился класс.cat file0.htm | sed 's#href=\"?[^",]*\"##' > file1.htm