felipecaon · November 23, 2023 16:53 · Nov 23, 2023 · Feb 10, 2022 · Feb 10, 2022 · Feb 10, 2022
diff --git a/alienvaultscraper.py b/alienvaultscraper.py
@@ -0,0 +1,37 @@
+import argparse
+import requests
+
+# Define the API endpoint and parameters
+
+base_url = "https://otx.alienvault.com/api/v1/indicators/domain/{domain}/url_list?limit=500&page={page}"
+current_domain = ""
+
+def make_request(domain, page):
+    while True:
+        current_domain = domain
+
+        formatted_url = base_url.format(domain=current_domain, page=page)
+        data = requests.get(formatted_url).json()
+
+        has_next = data['has_next']
+
+        for url_info in data["url_list"]:
+            print(url_info["url"])
+
+        if not has_next:
+            break  # Exit the loop when has_next is False
+
+        page = page + 1
+
+
+if __name__ == "__main__":
+    # Initialize argument parser
+    parser = argparse.ArgumentParser(description="Fetch URLs associated with a domain from AlienVault OTX")
+
+    # Add domain argument
+    parser.add_argument("domain", type=str, help="The domain for which to fetch URLs (e.g., qoo10.jp)")
+
+    # Parse command-line arguments
+    args = parser.parse_args()
+
+    make_request(domain=args.domain, page=1)
diff --git a/gistfile1.txt b/gistfile1.txt
@@ -1,22 +0,0 @@
-# get programs zips without boring ones
-curl https://chaos-data.projectdiscovery.io/index.json | jq '.[] | select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' | sed 's/"//g' | grep -v "telenet\|zendesk\|tumblr\|shopify\|alibaba\|cisco\|wp_engine\|vk\.com\|hubspot\|mail\.ru" >> chaos
-
-# download zips in parallel
-cat chaos | parallel -j 5 wget
-
-# unzip in parallel
-parallel unzip ::: *zip
-
-# remove zips and concatenate txt
-rm *zip ; cat *.txt >> subdomains
-
-# remove txt files
-rm *.txt
-
-# download resolvers
-wget https://raw.githubusercontent.com/felipecaon/resolvers/main/resolvers.txt -O resolvers
-
-# active validation
-puredns resolve subdomains -r resolvers --write resolved_dns_domain
-
-

diff --git a/gistfile1.txt b/gistfile1.txt
@@ -13,5 +13,10 @@ rm *zip ; cat *.txt >> subdomains
 # remove txt files
 rm *.txt
 
+# download resolvers
+wget https://raw.githubusercontent.com/felipecaon/resolvers/main/resolvers.txt -O resolvers
+
+# active validation
+puredns resolve subdomains -r resolvers --write resolved_dns_domain
 
 
diff --git a/gistfile1.txt b/gistfile1.txt
@@ -1 +1,17 @@
+# get programs zips without boring ones
 curl https://chaos-data.projectdiscovery.io/index.json | jq '.[] | select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' | sed 's/"//g' | grep -v "telenet\|zendesk\|tumblr\|shopify\|alibaba\|cisco\|wp_engine\|vk\.com\|hubspot\|mail\.ru" >> chaos
+
+# download zips in parallel
+cat chaos | parallel -j 5 wget
+
+# unzip in parallel
+parallel unzip ::: *zip
+
+# remove zips and concatenate txt
+rm *zip ; cat *.txt >> subdomains
+
+# remove txt files
+rm *.txt
+
+
+
diff --git a/gistfile1.txt b/gistfile1.txt
@@ -1 +1 @@
-curl https://chaos-data.projectdiscovery.io/index.json | jq '.[] | select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' | sed 's/"//g'
+curl https://chaos-data.projectdiscovery.io/index.json | jq '.[] | select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' | sed 's/"//g' | grep -v "telenet\|zendesk\|tumblr\|shopify\|alibaba\|cisco\|wp_engine\|vk\.com\|hubspot\|mail\.ru" >> chaos
diff --git a/gistfile1.txt b/gistfile1.txt
@@ -1 +1 @@
-curl https://chaos-data.projectdiscovery.io/index.json | jq '.[] | select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' | sed 's/"//g'
+curl https://chaos-data.projectdiscovery.io/index.json | jq '.[] | select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' | sed 's/"//g'
diff --git a/gistfile1.txt b/gistfile1.txt
@@ -0,0 +1 @@
+curl https://chaos-data.projectdiscovery.io/index.json | jq '.[] | select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' | sed 's/"//g'
Original file line number	Diff line number	Diff line change
		@@ -1 +1 @@
		curl https://chaos-data.projectdiscovery.io/index.json \| jq '.[] \| select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' \| sed 's/"//g'
		curl https://chaos-data.projectdiscovery.io/index.json \| jq '.[] \| select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' \| sed 's/"//g' \| grep -v "telenet\\|zendesk\\|tumblr\\|shopify\\|alibaba\\|cisco\\|wp_engine\\|vk\.com\\|hubspot\\|mail\.ru" >> chaos
Original file line number	Diff line number	Diff line change
		@@ -0,0 +1 @@
		curl https://chaos-data.projectdiscovery.io/index.json \| jq '.[] \| select((.platform=="hackerone") or (.platform=="bugcrowd") or (.platform=="intigriti")).URL' \| sed 's/"//g'