بسم الله الرحمن الرحيم

دعم spaCy اللغة العربية ، على مستوى ألفا فقط

تاريخ النشر : March 29, 2023

اللغة العربية وspaCy


يدعم spaCy اللغة العربية ، ولكن على مستوى ألفا فقط ، وهو ما يعني أساسًا دعم الترميز (انظر هنا). هذا كافٍ لتحميل النماذج الخارجية أو تدريب النموذج الخاص بك ، ومع ذلك ، في هذه الحالة ، يجب أن تكون قادرًا على تحميل هذا مثل أي نموذج HuggingFace - راجع هذه الأسئلة الشائعة.

https://stackoverflow.com/questions/74062240/using-arabert-model-with-spacy

في هذه الحالة سيبدو مثل:

nlp = spacy.blank("ar") # empty English pipeline
# create the config with the name of your model
# values omitted will get default values
config = {
    "model": {
        "@architectures": "spacy-transformers.TransformerModel.v3",
        "name": "aubmindlab/bert-large-arabertv02"
    }
}
nlp.add_pipe("transformer", config=config)
nlp.initialize() # XXX don't forget this step!
doc = nlp("فريك الذرة لذيذة")
print(doc._.trf_data) # all the Transformer output is stored here

العودة إلي مكتبة SpaCy