xwiz · September 23, 2013 14:13 · Jun 14, 2013
diff --git a/google_stt.py b/google_stt.py
@@ -0,0 +1,129 @@
+#!/usr/bin/python
+
+import flac.encoder as encoder
+import pyaudio
+import sys
+import requests
+import random
+
+from threading import Thread
+from Queue import Queue, Empty
+from time import sleep
+
+class google_stt_stream(object):
+    def __init__(self):
+        self.write_queue = Queue()
+        self.keep_streaming = True
+
+        self.upstream_url = "https://www.google.com/speech-api/full-duplex/v1/up?key=%(key)s&pair=%(pair)s&lang=en-US&maxAlternatives=20&client=chromium&continuous&interim"
+        self.upstream_headers = {'content-type': 'audio/x-flac; rate=16000'}
+        self.downstream_url = "https://www.google.com/speech-api/full-duplex/v1/down?pair=%(pair)s"
+        self.api_key = "<your_api_key>"
+
+    def generate_request_key(self):
+        return hex(random.getrandbits(64))[2:-1]
+
+    def start(self):
+        pair = self.generate_request_key()
+        upstream_url = self.upstream_url % {"pair": pair, "key": self.api_key}
+        downstream_url = self.downstream_url % {"pair": pair, "key": self.api_key}
+
+        self.session = requests.Session()
+        self.upstream_thread = Thread(target=self.upstream, args=(upstream_url,))
+        self.downstream_thread = Thread(target=self.downstream, args=(downstream_url,))
+
+        self.downstream_thread.start()
+        self.upstream_thread.start()
+
+    def stop(self):
+        print "Waiting write_queue to write all data"
+        self.write_queue.join()
+        print "Queue empty"
+        sleep(10)
+
+        self.keep_streaming=False
+        self.upstream_thread.join()
+        self.downstream_thread.join()
+
+    def write_data(self, data):
+        self.write_queue.put(data)
+
+    def gen_data(self):
+        while self.keep_streaming:
+            try:
+                item = self.write_queue.get(timeout=2)
+            except Empty:
+                return
+            yield item
+            self.write_queue.task_done()
+
+    def upstream(self, url):
+        print self.session.post(url, headers=self.upstream_headers, data=self.gen_data())
+
+    def downstream(self, url):
+        r = self.session.get(url, stream=True)
+        while self.keep_streaming:
+            try:
+                for line in r.iter_content():
+                    if not self.keep_streaming:
+                        break
+                    if line:
+                        sys.stdout.write(line)
+            except Exception as e:
+                print "Exception %s, restarting" %e
+                self.keep_streaming = False
+                self.upstream_thread.join()
+                self.keep_streaming = True
+                self.start()
+                return
+
+        print "end"
+
+stt = google_stt_stream()
+
+def write(enc, buf, samples, current_frame):
+    stt.write_data(buf)
+    #print current_frame, samples
+    return True
+
+#config
+chunk = 512
+FORMAT = pyaudio.paInt16
+CHANNELS = 1
+RATE = 16000
+THRESHOLD = 180 #The threshold intensity that defines silence signal (lower than).
+
+#open stream
+p = pyaudio.PyAudio()
+
+stream = p.open(format = FORMAT,
+                channels = CHANNELS,
+                rate = RATE,
+                input = True,
+                frames_per_buffer = chunk)
+
+
+# setup the encoder ...
+enc = encoder.StreamEncoder()
+enc.set_channels(1)
+#enc.set_bits_per_sample(wav.getsampwidth()*8)
+enc.set_sample_rate(16000)
+#enc.set_compression_level(0)
+
+# initialize
+if enc.init_stream(write) != encoder.FLAC__STREAM_ENCODER_OK:
+    print "Error"
+    sys.exit()
+
+# start encoding !
+stt.start()
+nsamples = 512
+while 1:
+    data = stream.read(nsamples)
+    if not data:
+        enc.finish()
+        break
+    enc.process(data, nsamples)
+    #sleep(.001)
+
+stt.stop()