SudShekhar · August 29, 2015 14:13 · Jan 14, 2015 · Jan 14, 2015 · Jan 14, 2015 · Jan 14, 2015
diff --git a/scrapyTutorialFile.py b/scrapyTutorialFile.py
@@ -32,4 +32,4 @@ def parse(self,response):
                 l.add_xpath('link','a/@href')
                 l.add_xpath('desc','text()')
                 it= l.load_item()
-                yield i
+                yield it
diff --git a/scrapyTutorialFile.py b/scrapyTutorialFile.py
@@ -16,12 +16,16 @@ def parse(self,response):
                 @returns requests 0 0
                 @scrapes title link 
         """
+#       CODE 1
 #       for sel in response.xpath('//ul/li'):
 #               item = DmozItem()
 #               item['title'] = sel.xpath('a/text()').extract()
 #               item['link'] = sel.xpath('a/@href').extract()
 #               item['desc'] = sel.xpath('text()').extract()
 #               yield item
+
+
+#       CODE 2
         for sel in response.xpath("//ul/li"):   
                 l = ItemLoader(item=DmozItem(),selector=sel)
                 l.add_xpath('title','a/text()')

diff --git a/scrapyTutorialFile → scrapyTutorialFile.py b/scrapyTutorialFile → scrapyTutorialFile.py
diff --git a/scrapyTutorialFile b/scrapyTutorialFile
@@ -0,0 +1,31 @@
+import scrapy
+from tutorial.items import DmozItem
+from scrapy.contrib.loader import ItemLoader
+class DmozSpider(scrapy.Spider):
+    name="dmoz"
+    allowed_domains=["dmoz.org"]
+    start_urls=[
+        "http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
+        "http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
+    ]   
+
+    def parse(self,response):
+        """Some contracts are used here
+                @url http://www.dmoz.org/Computers/Programming/Languages/Python/Books/
+                @returns items 1 100
+                @returns requests 0 0
+                @scrapes title link 
+        """
+#       for sel in response.xpath('//ul/li'):
+#               item = DmozItem()
+#               item['title'] = sel.xpath('a/text()').extract()
+#               item['link'] = sel.xpath('a/@href').extract()
+#               item['desc'] = sel.xpath('text()').extract()
+#               yield item
+        for sel in response.xpath("//ul/li"):   
+                l = ItemLoader(item=DmozItem(),selector=sel)
+                l.add_xpath('title','a/text()')
+                l.add_xpath('link','a/@href')
+                l.add_xpath('desc','text()')
+                it= l.load_item()
+                yield i