<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: скрипт извлекующий урлы</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/5805.html</link>
    <description>подскажите, как сделать скрипт который бы извлек все урлы содержащиеся например на страничке: http://top100.rambler.ru/top100/Automotive/index.shtml.ru? &lt;br&gt;&lt;br&gt;</description>

<item>
    <title>скрипт извлекующий урлы (angra)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/5805.html#3</link>
    <pubDate>Thu, 12 Jun 2008 19:32:15 GMT</pubDate>
    <description>Специально для вас цитирую:&lt;br&gt;&amp;gt;можно поправить регексп.&lt;br&gt;&lt;br&gt;В данном случае добавляем символ &quot;-&quot; в класс допустимых символов: m(http://&#091;&#092;w./&#092;-&#093;+)g)&apos;&lt;br&gt;Почитайте man perlre или Mastering Regular Expressions, знание регексов значительно облегчает жизнь админа. &lt;br&gt;</description>
</item>

<item>
    <title>скрипт извлекующий урлы (snooper)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/5805.html#2</link>
    <pubDate>Thu, 12 Jun 2008 13:05:32 GMT</pubDate>
    <description>&amp;gt;wget -qO-  http://top100.rambler.ru/top100/Automotive/index.shtml.ru &amp;#124; perl -e &apos;print join(&quot;&#092;n&quot;, join(&quot;&quot;, &amp;lt;&amp;gt;)=~m(http://&#091;&#092;w./&#093;+)g)&apos;&lt;br&gt;&lt;br&gt;нашел ошибку, урлы в которых есть тире &quot;post-card.ru&quot; не извлекаются...&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>скрипт извлекующий урлы (Mil)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/5805.html#1</link>
    <pubDate>Tue, 10 Jun 2008 04:29:19 GMT</pubDate>
    <description>&amp;gt;подскажите, как сделать скрипт который бы извлек все урлы содержащиеся например на &lt;br&gt;&amp;gt;страничке: http://top100.rambler.ru/top100/Automotive/index.shtml.ru? &lt;br&gt;&lt;br&gt;Возможно множество решений.&lt;br&gt;Вот пример, от которого можно оттолкнуться и получить то, что вам надо.&lt;br&gt;&lt;br&gt;wget -qO-  http://top100.rambler.ru/top100/Automotive/index.shtml.ru &amp;#124; perl -e &apos;print join(&quot;&#092;n&quot;, join(&quot;&quot;, &amp;lt;&amp;gt;)=~m(http://&#091;&#092;w./&#093;+)g)&apos;&lt;br&gt;&lt;br&gt;но учтите, что он вытаскивает именно *все* урлы (как вы и просили), включая картинки css-ки... при этом вытаскиваются только абсолютные урлы. в общем, не думаю, что это именно то, что вы хотите. чтобы вытащить урлы по другим признакам можно поправить регексп.&lt;br&gt;</description>
</item>

</channel>
</rss>
