deidentify / Git / [7fc5df] /deidentify/tokenizer/tokenizer

Models:

philipB/

deidentify

Downloads: 1

[7fc5df]: / deidentify / tokenizer / tokenizer_en.py

History

Download this file

12 lines (6 with data), 212 Bytes

import spacy

from deidentify.tokenizer import Tokenizer

NLP = spacy.load('en_core_web_sm')

class TokenizerEN(Tokenizer):

    def parse_text(self, text: str) -> spacy.tokens.doc.Doc:
        return NLP(text)