The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Первый релиз многопоточного HTML-парсера MyHTML"
Версия для распечатки Пред. тема | След. тема
Форум Разговоры, обсуждение новостей
Исходное сообщение [ Отслеживать ]
Подсказка: Ссылки "<<" и ">>" открывают первые и последние 10 сообщений.
. "Первый релиз многопоточного HTML-парсера MyHTML" +3 +/
Сообщение от lastmacemail (?), 14-Июл-16, 10:44 
> Ну, вообще-то реальный веб это не HTML5.
> Парсер для настоящего (а не сферического в вакууме) браузера, к сожалению, должен
> поддерживать различные ухищрения чтобы парсить кривой HTML и XHTML различных версий.

Всё это парсер делает. Всё ровно так же как современные браузеры. Спецификация HTML оговаривает что и как должно происходить в "непонятных" ситуациях.

В спецификации можно посмотреть здесь:
An introduction to error handling and strange cases in the parser:
https://html.spec.whatwg.org/multipage/syntax.html#an-introd...

Adoption agency algorithm:
https://html.spec.whatwg.org/multipage/syntax.html#adoption-...

Ответить | Правка | Наверх | Cообщить модератору

Оглавление
Первый релиз многопоточного HTML-парсера MyHTML, opennews, 13-Июл-16, 20:16  [смотреть все]
Форумы | Темы | Пред. тема | След. тема



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру