Skip to content

Instantly share code, notes, and snippets.

@saravananpsg
Forked from charlesBochet/ner_french.py
Created January 28, 2019 04:37
Show Gist options
  • Save saravananpsg/c8bda8fce2a1b9a5cd8f5b2a065c227f to your computer and use it in GitHub Desktop.
Save saravananpsg/c8bda8fce2a1b9a5cd8f5b2a065c227f to your computer and use it in GitHub Desktop.

Revisions

  1. @charlesBochet charlesBochet revised this gist Apr 10, 2018. 1 changed file with 2 additions and 2 deletions.
    4 changes: 2 additions & 2 deletions ner_french.py
    Original file line number Diff line number Diff line change
    @@ -9,13 +9,13 @@
    os.environ['JAVA_HOME'] = java_path

    sentence = u"La première Falcon Heavy de l'entreprise SpaceX, " \
    "la plus puissante fusée américaine jamais " \
    "la plus puissante fusée des Etats-Unis jamais " \
    "lancée depuis plus de quarante ans, devrait bien " \
    "emporter le roadster de l'entrepreneur américain, " \
    "mais sur une orbite bien différente. Elon Musk a le sens du spectacle."

    jar = './stanford-ner-tagger/stanford-ner.jar'
    model = './stanford-ner-tagger/ner-model-french.ser'
    model = './stanford-ner-tagger/trained-ner-model-french.ser.gz'

    ner_tagger = StanfordNERTagger(model, jar, encoding='utf8')

  2. @charlesBochet charlesBochet revised this gist Dec 4, 2017. 1 changed file with 4 additions and 7 deletions.
    11 changes: 4 additions & 7 deletions ner_french.py
    Original file line number Diff line number Diff line change
    @@ -8,19 +8,16 @@
    java_path = "/usr/lib/jvm/java-8-oracle"
    os.environ['JAVA_HOME'] = java_path

    sentence = u"La première Falcon Heavy de l'entreprise SpaceX, la plus puissante fusée américaine jamais " \
    "lancée depuis plus de quarante ans, devrait bien emporter le roadster de l'entrepreneur américain, " \
    sentence = u"La première Falcon Heavy de l'entreprise SpaceX, " \
    "la plus puissante fusée américaine jamais " \
    "lancée depuis plus de quarante ans, devrait bien " \
    "emporter le roadster de l'entrepreneur américain, " \
    "mais sur une orbite bien différente. Elon Musk a le sens du spectacle."

    jar = './stanford-ner-tagger/stanford-ner.jar'
    model = './stanford-ner-tagger/ner-model-french.ser'

    # Load NER Tagger with english model
    ner_tagger = StanfordNERTagger(model, jar, encoding='utf8')

    # Split sentence into words
    words = nltk.word_tokenize(sentence)

    # Tag words
    print(ner_tagger.tag(words))

  3. @charlesBochet charlesBochet created this gist Dec 4, 2017.
    26 changes: 26 additions & 0 deletions ner_french.py
    Original file line number Diff line number Diff line change
    @@ -0,0 +1,26 @@
    # coding: utf-8

    import nltk
    from nltk.tag.stanford import StanfordNERTagger

    # Optional
    import os
    java_path = "/usr/lib/jvm/java-8-oracle"
    os.environ['JAVA_HOME'] = java_path

    sentence = u"La première Falcon Heavy de l'entreprise SpaceX, la plus puissante fusée américaine jamais " \
    "lancée depuis plus de quarante ans, devrait bien emporter le roadster de l'entrepreneur américain, " \
    "mais sur une orbite bien différente. Elon Musk a le sens du spectacle."

    jar = './stanford-ner-tagger/stanford-ner.jar'
    model = './stanford-ner-tagger/ner-model-french.ser'

    # Load NER Tagger with english model
    ner_tagger = StanfordNERTagger(model, jar, encoding='utf8')

    # Split sentence into words
    words = nltk.word_tokenize(sentence)

    # Tag words
    print(ner_tagger.tag(words))