programowalnia.info

Nowy mechanizm forum! Problemy i sugestie proszę zgłaszać do administratora
Teraz jest 2010-03-10, 14:18

Wszystkie czasy w strefie UTC + 1




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 1 ] 
Autor Wiadomość
 Tytuł: [C#] Parsowanie html
PostNapisane: 2009-12-19, 21:24 
Offline

Dołączył(a): 2008-11-16, 16:44
Posty: 4
Mam pewien problem.
Chciałbym zrobić parsowanie formularzy zawartych w pliku html bez użycia wyrażeń regularnych.
Chodzi mi o uzyskanie zmiennej string, zawierającej <input... />, oraz <select></select> wraz z zawartością.
Z selectami udało mi się to, mam natomiast problem z inputami.
Najpierw pobieram do zmiennej formy wszystkie formularze. Potem zaś:

Kod:
do
                        {
                                a = formy.IndexOf("<input");
                                b = formy.IndexOf("/>");
                                if ((b + 9) < a)
                                {
                                    MessageBox.Show("Błąd");
                                    goto Koniec;
                                }
                                else
                                {
                                    input = input + formy.Substring(a, ((b + 2) - a));
                                    formy = formy.Remove(0, (b + 2)); // Ponieważ przeszukiwanie zmiennej formy
                              // przebiega od jej początku za każdym razem
                              // usuwany jest tekst, który został dodany
                              // do input
                                }
                           
                        } while (formy1.Contains("<input"));


input to zmienna string zawierająca tekst po parsowaniu.
Problem polega na tym, że w pliku znajdują się również znaczniki <input... >(zamknięte bez prawego ukośnika).

Funkcja IndexOf() jakby ich nie widziała, poza tym ich obecność powoduje że zmienna b bywa mniejsza od zmiennej a.

To z kolei powoduje wywołanie funkcji Substring() z długością łańcucha mniejszą od zera.
Byćmoże są w Visual C# 2008 Express Edition funkcje wspomagające parsowanie html, ale za krótko w tym siedzę żeby o

tym wiedzieć.

Pomóżcie jak możecie :(


Góra
 Zobacz profil Wyślij e-mail  
 
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 1 ] 

Wszystkie czasy w strefie UTC + 1


Kto przegląda forum

Użytkownicy przeglądający to forum: Brak zalogowanych użytkowników i 0 gości


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów

Szukaj:
Skocz do:  
 cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
opisy gg :: portal zdrowie :: sport i turystyka :: katalog dobrych stron :: ciekawostki komputerowe :: prawo i podatki :: Numizmatyka

Przyjazne użytkownikom polskie wsparcie phpBB3 - phpBB3.PL
phpBB SEO