kylebgorman · June 14, 2021 20:51 · Jun 14, 2021 · Jun 14, 2021 · Jun 14, 2021
diff --git a/rubert-embedding.py b/rubert-embedding.py
@@ -12,5 +12,5 @@
 sentence = "Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему."
 
 tokenized = tokenizer(sentence, return_tensors="pt")
-embeddings = model(**tokenized)
-print(embeddings)
+embeddings = model(**tokenized, output_hidden_states=True).hidden_states[0]
+print(embeddings)
diff --git a/rubert-embedding.py b/rubert-embedding.py
@@ -13,4 +13,4 @@
 
 tokenized = tokenizer(sentence, return_tensors="pt")
 embeddings = model(**tokenized)
-print(embedding)
+print(embeddings)
diff --git a/rubert-embedding.py b/rubert-embedding.py
@@ -0,0 +1,16 @@
+#!/usr/bin/env python
+
+# Documented in: https://metatext.io/models/DeepPavlov-rubert-base-cased
+
+import transformers
+
+
+model_name = "DeepPavlov/rubert-base-cased"
+model = transformers.AutoModel.from_pretrained(model_name)
+tokenizer = transformers.AutoTokenizer.from_pretrained(model_name)
+
+sentence = "Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему."
+
+tokenized = tokenizer(sentence, return_tensors="pt")
+embeddings = model(**tokenized)
+print(embedding)
No results found