DrOctogon · August 29, 2015 14:11 · Sep 24, 2010 · Sep 24, 2010 · Sep 24, 2010 · Sep 24, 2010
diff --git a/csv_splitter.py b/csv_splitter.py
@@ -27,7 +27,7 @@ def split(filehandler, delimiter=',', row_limit=10000,
          output_path,
          output_name_template  % current_piece
     )
-    current_out_writer = csv.writer(open(current_out_path, 'w'))
+    current_out_writer = csv.writer(open(current_out_path, 'w'), delimiter=delimiter)
     current_limit = row_limit
     if keep_headers:
         headers = reader.next()
@@ -40,7 +40,7 @@ def split(filehandler, delimiter=',', row_limit=10000,
                output_path,
                output_name_template  % current_piece
             )
-            current_out_writer = csv.writer(open(current_out_path, 'w'))
+            current_out_writer = csv.writer(open(current_out_path, 'w'), delimiter=delimiter)
             if keep_headers:
                 current_out_writer.writerow(headers)
         current_out_writer.writerow(row)
diff --git a/csv_splitter.py b/csv_splitter.py
@@ -24,6 +24,7 @@ def split(filehandler, delimiter=',', row_limit=10000,
     reader = csv.reader(filehandler, delimiter=delimiter)
     current_piece = 1
     current_out_path = os.path.join(
+         output_path,
          output_name_template  % current_piece
     )
     current_out_writer = csv.writer(open(current_out_path, 'w'))
@@ -36,6 +37,7 @@ def split(filehandler, delimiter=',', row_limit=10000,
             current_piece += 1
             current_limit = row_limit * current_piece
             current_out_path = os.path.join(
+               output_path,
                output_name_template  % current_piece
             )
             current_out_writer = csv.writer(open(current_out_path, 'w'))

diff --git a/csv_splitter.py b/csv_splitter.py
@@ -11,7 +11,7 @@ def split(filehandler, delimiter=',', row_limit=10000,
 
         `row_limit`: The number of rows you want in each output file. 10,000 by default.
         `output_name_template`: A %s-style template for the numbered output files.
-        `output_path`: Where to stick the output files
+        `output_path`: Where to stick the output files.
         `keep_headers`: Whether or not to print the headers in each output file.
 
     Example usage:

diff --git a/csv_splitter.py b/csv_splitter.py
@@ -9,7 +9,7 @@ def split(filehandler, delimiter=',', row_limit=10000,
 
     Arguments:
 
-        `row_limit`: The number of rows you want in each output file
+        `row_limit`: The number of rows you want in each output file. 10,000 by default.
         `output_name_template`: A %s-style template for the numbered output files.
         `output_path`: Where to stick the output files
         `keep_headers`: Whether or not to print the headers in each output file.

diff --git a/csv_splitter.py b/csv_splitter.py
@@ -17,7 +17,7 @@ def split(filehandler, delimiter=',', row_limit=10000,
     Example usage:
     
         >> from toolbox import csv_splitter;
-        >> csv_splitter.split(csv.splitter(open('/home/ben/input.csv', 'r')));
+        >> csv_splitter.split(open('/home/ben/input.csv', 'r'));
     
     """
     import csv

diff --git a/csv_splitter.py b/csv_splitter.py
@@ -17,7 +17,7 @@ def split(filehandler, delimiter=',', row_limit=10000,
     Example usage:
     
         >> from toolbox import csv_splitter;
-        >> csv_splitter.split(csv.splitter(open('/home/ben/Desktop/lasd/2009-01-02 [00.00.00].csv', 'r')));
+        >> csv_splitter.split(csv.splitter(open('/home/ben/input.csv', 'r')));
     
     """
     import csv

diff --git a/Python CSV splitter → csv_splitter.py b/Python CSV splitter → csv_splitter.py
diff --git a/Python CSV splitter b/Python CSV splitter
@@ -0,0 +1,44 @@
+import os
+
+def split(filehandler, delimiter=',', row_limit=10000, 
+    output_name_template='output_%s.csv', output_path='.', keep_headers=True):
+    """
+    Splits a CSV file into multiple pieces.
+
+    A quick bastardization of the Python CSV library.
+
+    Arguments:
+
+        `row_limit`: The number of rows you want in each output file
+        `output_name_template`: A %s-style template for the numbered output files.
+        `output_path`: Where to stick the output files
+        `keep_headers`: Whether or not to print the headers in each output file.
+
+    Example usage:
+
+        >> from toolbox import csv_splitter;
+        >> csv_splitter.split(csv.splitter(open('/home/ben/Desktop/lasd/2009-01-02 [00.00.00].csv', 'r')));
+
+    """
+    import csv
+    reader = csv.reader(filehandler, delimiter=delimiter)
+    current_piece = 1
+    current_out_path = os.path.join(
+         output_name_template  % current_piece
+    )
+    current_out_writer = csv.writer(open(current_out_path, 'w'))
+    current_limit = row_limit
+    if keep_headers:
+        headers = reader.next()
+        current_out_writer.writerow(headers)
+    for i, row in enumerate(reader):
+        if i + 1 > current_limit:
+            current_piece += 1
+            current_limit = row_limit * current_piece
+            current_out_path = os.path.join(
+               output_name_template  % current_piece
+            )
+            current_out_writer = csv.writer(open(current_out_path, 'w'))
+            if keep_headers:
+                current_out_writer.writerow(headers)
+        current_out_writer.writerow(row)