CrazyDaffodils · January 13, 2020 23:33 · Jan 13, 2020 · Jan 13, 2020 · Jan 13, 2020 · Jan 13, 2020
diff --git a/pca b/pca
@@ -1,3 +1,5 @@
+from sklearn.decomposition import PCA
+import seaborn as sns
 #Visualize data using Principal Component Analysis.
 print("Principal Component Analysis (PCA)")
 pca = PCA(n_components = 2).fit_transform(X_std)

diff --git a/pca b/pca
@@ -4,16 +4,4 @@ pca = PCA(n_components = 2).fit_transform(X_std)
 pca_df = pd.DataFrame(data=pca, columns=['PC1','PC2']).join(labels)
 palette = sns.color_palette("muted", n_colors=5)
 sns.set_style("white")
-sns.scatterplot(x='PC1',y='PC2',hue='Class',data=pca_df, palette=palette, linewidth=0.2, s=30, alpha=1).set_title('PCA')
-
-#Fitting PCA on Data
-print("Explained Variance of PCA components")
-pca_std = PCA().fit(X_std)
-percent_variance=pca_std.explained_variance_ratio_*100
-#Plotting Cumulative Summation of the Explained Variance
-plt.figure()
-plt.plot(np.cumsum(pca_std.explained_variance_ratio_))
-plt.xlabel('Number of Components')
-plt.ylabel('Variance (%)') #for each component
-plt.title('Cancer Dataset - Cumulative Explained Variance')
-plt.show()
+sns.scatterplot(x='PC1',y='PC2',hue='Class',data=pca_df, palette=palette, linewidth=0.2, s=30, alpha=1).set_title('PCA')
diff --git a/pca b/pca
@@ -4,4 +4,16 @@ pca = PCA(n_components = 2).fit_transform(X_std)
 pca_df = pd.DataFrame(data=pca, columns=['PC1','PC2']).join(labels)
 palette = sns.color_palette("muted", n_colors=5)
 sns.set_style("white")
-sns.scatterplot(x='PC1',y='PC2',hue='Class',data=pca_df, palette=palette, linewidth=0.2, s=30, alpha=1).set_title('PCA')
+sns.scatterplot(x='PC1',y='PC2',hue='Class',data=pca_df, palette=palette, linewidth=0.2, s=30, alpha=1).set_title('PCA')
+
+#Fitting PCA on Data
+print("Explained Variance of PCA components")
+pca_std = PCA().fit(X_std)
+percent_variance=pca_std.explained_variance_ratio_*100
+#Plotting Cumulative Summation of the Explained Variance
+plt.figure()
+plt.plot(np.cumsum(pca_std.explained_variance_ratio_))
+plt.xlabel('Number of Components')
+plt.ylabel('Variance (%)') #for each component
+plt.title('Cancer Dataset - Cumulative Explained Variance')
+plt.show()
diff --git a/pca b/pca
@@ -0,0 +1,7 @@
+#Visualize data using Principal Component Analysis.
+print("Principal Component Analysis (PCA)")
+pca = PCA(n_components = 2).fit_transform(X_std)
+pca_df = pd.DataFrame(data=pca, columns=['PC1','PC2']).join(labels)
+palette = sns.color_palette("muted", n_colors=5)
+sns.set_style("white")
+sns.scatterplot(x='PC1',y='PC2',hue='Class',data=pca_df, palette=palette, linewidth=0.2, s=30, alpha=1).set_title('PCA')
No results found