y-lan · July 20, 2023 14:16 · Jul 20, 2023 · Jul 20, 2023 · Jul 20, 2023 · Jul 20, 2023
diff --git a/count_llama_tokens.py b/count_llama_tokens.py
@@ -8,4 +8,4 @@ def count(text):
 def parallel_count(texts):
   from joblib import Parallel, delayed
   results = Parallel(n_jobs=-1)(delayed(count)(text) for text in texts)
-  return sum([results])
+  return sum(results)
diff --git a/count_llama_tokens.py b/count_llama_tokens.py
@@ -1,11 +1,11 @@
 from transformers import LlamaTokenizer
 
-tokenizer = LlamaTokenizer.from_pretrained('meta-llama/Llama-2-7b')
+tokenizer = LlamaTokenizer.from_pretrained('decapoda-research/llama-7b-hf')
 
 def count(text):
   return len(tokenizer(text)['input_ids'])
 
 def parallel_count(texts):
   from joblib import Parallel, delayed
-  results = Parallel(n_jobs=-1)(delayed(count)(text) for text in texts))
+  results = Parallel(n_jobs=-1)(delayed(count)(text) for text in texts)
   return sum([results])
diff --git a/count.py → count_llama_tokens.py b/count.py → count_llama_tokens.py
diff --git a/count.py b/count.py
@@ -0,0 +1,11 @@
+from transformers import LlamaTokenizer
+
+tokenizer = LlamaTokenizer.from_pretrained('meta-llama/Llama-2-7b')
+
+def count(text):
+  return len(tokenizer(text)['input_ids'])
+
+def parallel_count(texts):
+  from joblib import Parallel, delayed
+  results = Parallel(n_jobs=-1)(delayed(count)(text) for text in texts))
+  return sum([results])
No results found