<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: выдрать адреса ссылок</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID8/5538.html</link>
    <description>Пытаюсь выдрать со странички адреса ссылок делаю так...&lt;br&gt;preg_match_all(&apos;/href&#091; &#093;*=&#091; &#093;*&#091;&#092;&apos;&quot;&#096;&#093;&#123;0,1&#125;(.+)&#091;&#092;&apos;&quot;&#096; &#093;&#123;0,1&#125;.*&amp;gt;/&apos;, $str, $ara,PREG_PATTERN_ORDER);&lt;br&gt;потом обрабатываю массив $ara&#091;1&#093;. Но чтото не работает. Если мы имеем например ссылки&lt;br&gt;&amp;lt;a href=&quot;index.php&quot; &amp;gt;Главная &amp;lt;/a&amp;gt; ..... &amp;lt;a href=&quot;news.php&quot; &amp;gt;Новости&amp;lt;/a&amp;gt; и т.д.&lt;br&gt;Короче скрипт выдает такую строчку &quot;index.php&apos; &amp;gt;Главная&amp;lt;/a&amp;gt;&amp;lt;b&amp;gt;&amp;lt;/td&amp;gt;&amp;lt;/&quot;&lt;br&gt;Коче не дает нужного результата&lt;br&gt;</description>

<item>
    <title>выдрать адреса ссылок (angra)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID8/5538.html#1</link>
    <pubDate>Fri, 08 Feb 2008 23:28:24 GMT</pubDate>
    <description>Пых и регексы, выглядит кошмарно. И после такого некоторые не понимают в чем преимущество перла в этой области. &lt;br&gt;Не знаю есть ли туториалы для пыха по регексам, но могу порекомедовать man perlre и &quot;Mastering regular expressions&quot; O&apos;Reilly. Особое внимание обратить на понятие жадности(greedy) и вообще на механику регексов. В простом издложении на вашем примере&lt;br&gt;1. .+ захватывает все до конца строки.&lt;br&gt;2. проверяется совпадение части регекса после .+&lt;br&gt;3. если совпадения не произошло, то .+ отдает один символ и идет возврат к пункту 2, до тех пор пока в .+ есть хоть один символ(ибо +, а не *)&lt;br&gt;Не знаю поддерживается ли в пыхе возможность обрезать жадность, но в перле это делается добавлением ? после квантифаера. То есть вместо .+ ставим .+?. Кроме того обычная практика вместо &quot;.&quot; использовать класс ограничтителей, например вместо .+ поставить &#091;^&apos;&quot;&amp;gt;&#093;+&lt;br&gt;</description>
</item>

</channel>
</rss>
