asp.net - HTML Agility Pack Syntax -
& lt; div वर्ग = "लोगोडस" & gt; जीएनबी रोड, चंदमरी, गुवाहाटी - 781003 | & Lt; a href = "http://www.justdial.com/Guwahati/Kiran-Mistanna-Bhandar-<near>- चांदीमरी / 99 99 पीएक्स 361- एक्स 361-1230284509 जी 9 वी 5 बी 2-डीसी_आर 3 वी 3 वाईडएचएचडीजीकेजीएमएमएमएफएजीवीएसबी 3 आईजीक्यू 2 एफआरजेक्यू ==_BZDET/map" & gt; मानचित्र देखें & lt; / a & gt; & lt; br & gt; & Lt; p & gt; & Lt; span class = "gray" & gt; कॉल: & lt; / span & gt; & lt; span शैली = "रंग: # 424242; फ़ॉन्ट-आकार: 12px;" & gt; + (91) -9954843180 & lt; / span & gt; & Lt; span शैली = "रंग: # 424242;" & gt; | & lt; / span & gt; & Lt; a href = "http://contest.justdial.com/contest/register.php?utm_source=rsbnr&utm_medium=banner&cont_ref=rsbnr" शैली = "फ़ॉन्ट-आकार: 12px; प्रदर्शन: इनलाइन -block, " Onclick = "_ ct ('विन Ipad2', 'ltpg');" लक्ष्य = "_ रिक्त"> gt; & lt; b & gt; विन iPad2 & lt; / b & gt; & lt; / a & gt; & Lt; / p & gt; & Lt; p & gt; & Lt; span class = "gray" & gt; यह भी देखें: & lt; / span & gt; & Lt; b & gt; केक की दुकानें & lt; / b & gt ;, & lt; a href = "http://www.justdial.com/Guwahati/Bakeries/ct-10033880" & gt; बेकरियां & lt; / a & gt ;, & lt; a href = "http://www.justdial.com/Guwahati/Confectionery-Retailers/ct-10127628" & gt; हलवाई की दुकान के खुदरा विक्रेता & lt; / a & gt; & Lt; / p & gt; & Lt; / div & gt; मैं एचटीएमएल एगिलिटी पैक का उपयोग कर रहा हूँ ... ii पता केवल [तारों के बीच] को निकालना चाहता है .. क्या वाक्यविन्यास होना चाहिए ?? कृपया मदद करें।
अद्यतन: मैं निम्न कोड का उपयोग कर रहा हूं
संरक्षित उप बटन 1_Click (ऑब्जेक्ट के रूप में बाय-ओर भेजने वाला, ऑब्जेक्ट के रूप में, सिस्टम के रूप में। एवेन्टएआरजी) बटन 1 हैंडल्स। डीक वेब वेब पर क्लिक करें = नया एचएमएल वेब () मंद दस्तावेज़ = webGet.Load ("http://www.justdial.com/Guwahati/Bachelor-Cake/ct-10070075") मंद नोड्स 1 = दस्तावेज़। दस्तावेज़। चयन करें ("// * [@ वर्ग = 'LogoDesc'] "प्रत्येक नोड के लिए नोड्स 1 मेस्ब्स (नोड। इनरटेक्स्ट) में अगला नोड एंड सब इस कोड स्निपेट का उपयोग करके मुझे डिव के अंदर सभी विवरण मिलते हैं ... मैं बस पता करना चाहते हैं।
चपलता पैक पर कोई विचार नहीं है, लेकिन यहां एक सीधे स्क्रीन स्क्रेपर है: <पूर्व> स्ट्रिंग पृष्ठ = विधि। गेट पृष्ठ ("http://www.yoururl.com"); Int firstStars = page.IndexOf ("***"); स्ट्रिंग सेकंड = पेज। शटलिंग (प्रथमस्टार); Int secondStars = second.IndexOf ("***"); // पहले तीन सितारों को छोड़ने के लिए 3 जोड़ें। मई की आवश्यकता नहीं है +3, याद नहीं कर सकते स्ट्रिंग एड्रेस = पेज। शटलिंग (0 + 3, सेकंडस्टार); सार्वजनिक स्थिर स्ट्रिंग GetPage (स्ट्रिंग url) {WebClient webClient = नया WebClient (); बाइट [] req एचटीएमएल; स्ट्रिंग पृष्ठ = स्ट्रिंग। खाली; यूटीएफ 8 एन्कोडिंग objUTF8 = नया यूटीएफ 8 एन्कोडिंग (); कोशिश {reqHTML = webClient.DownloadData (url); पृष्ठ = objUTF8.GetString (reqHTML); } पकड़ (अपवाद तेंदुलकर) {} रिटर्न पृष्ठ; }
Comments
Post a Comment