Mikhail Gusarov wrote: > Twas brillig at 11:08:04 13.12.2008 UTC+02 when storch...@gmail.com did > gyre and gimble: > SS> Мы можем гарантировать, что абзац не только начинается <p>, но и > SS> заканчивается </p>, а не одним из десятков совершенно посторонних > SS> тегов. > > Это проблема парсера - построить дерево, с которым удобно > обращаться. Настоящая же проблема в том, что валидного HTML почти > не существует.
Я имею в виду потоковый SAX-парсер. Как мы будем хранить разбираемую информацию, и будем ли вообще хранить её всю — это наше дело. -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org