# Code for Jupyter/IPython Notebook environment

from keras.models import Sequential  
from keras.layers.core import TimeDistributedDense, Activation, Dropout  
from keras.layers.recurrent import GRU
import numpy as np
from keras.utils.layer_utils import print_layer_shapes

%matplotlib inline
import matplotlib.pyplot as plt

# pip install Quandl #to get Quandl Python API
import Quandl

def _load_data(data, steps = 40):  
    docX, docY = [], []
    for i in range(0, data.shape[0]/steps-1):
        docX.append(data[i*steps:(i+1)*steps,:])
        docY.append(data[(i*steps+1):((i+1)*steps+1),:])
    alsX = np.array(docX)
    alsY = np.array(docY)
    return alsX, alsY
    

def train_test_split(data, test_size=0.15):  
    #    This just splits data to training and testing parts
    X,Y = _load_data(data)
    ntrn = round(X.shape[0] * (1 - test_size))
    perms = np.random.permutation(X.shape[0])
    X_train, Y_train = X.take(perms[0:ntrn],axis=0), Y.take(perms[0:ntrn],axis=0)
    X_test, Y_test = X.take(perms[ntrn:],axis=0),Y.take(perms[ntrn:],axis=0)
    return (X_train, Y_train), (X_test, Y_test) 
    
# Get prices from Quandl
prices = Quandl.get('WIKI/VZ') # Quandl returns DataFrame
_prices = prices[['Open', 'Close']]
print(_prices.values.shape)

plt.plot(_prices.values)

# For debug purposes
(X, Y) = _load_data(_prices.values)
print(X.shape)
print(Y.shape)

for i in range(0, X.shape[0]):
    plt.plot(np.arange(i*40,i*40+40), X[i])
    
for i in range(0, 5):
    plt.plot(np.arange(i*40,i*40+40), X[i])
    
np.random.seed(0)  # For reproducability
#data = np.genfromtxt('closingAdjLog.csv', delimiter=',')
(X_train, y_train), (X_test, y_test) = train_test_split(_prices.values)  # retrieve data
print "Data loaded."

print(X_train.shape)
print(y_train.shape)

# Simplier model than in initial post
in_out_neurons = 2  
hidden_neurons = 2

model = Sequential()  
model.add(GRU(hidden_neurons, input_dim=in_out_neurons, return_sequences=True))
model.add(Dropout(0.2))
model.add(TimeDistributedDense(in_out_neurons))  
model.add(Activation("linear"))  
model.compile(loss="mean_squared_error", optimizer="rmsprop") 
print "Model compiled."

print_layer_shapes(model, input_shapes =(X_train.shape))

# and now train the model. 
model.fit(X_train, y_train, batch_size=30, nb_epoch=200, validation_data=(X_test, y_test))  
print_layer_shapes(model, input_shapes =(X_train.shape))
predicted = model.predict(X_test)  
print np.sqrt(((predicted - y_test) ** 2).mean(axis=0)).mean()  # Printing RMSE