بسم الله الرحمن الرحيم

توليد النصوص باستخدام Keras.

تاريخ النشر : Aug. 29, 2020

توليد النصوص باستخدام كيراس عن طريق شبكة عصبية


/جمع وترتيب :محمود جابر / الموضوع لازال تحت التطوير
Process Text
عمل دالة لقراءة نص من ملف
عمل دالة لحذف علامات الترقيم
Clean Text
Tokenize the text and create Sequences with keras.
import spacy

nlp =spacy.load('en',disable=['parser','tagger','ner')


## nlp.max_length= 1000000
from kerasn.processing.text import Tokenizer

tokenizer = Tokenizer()
tokenizer.fit_on_texts(text_sequences)

sequences =tokenizer.texts_to_sequences(text_sequences)
from keras.utils import to_categorical

X = sequences[:,:-1]

y = sequences[:,-1]

y= to_categorical(y,num_classes=vocuaulary_size+1)
إنشاء نموذج الشبكة العصبية
from keras.models import Sequential
from Keras.layers import Dense,LSTM,Embedding
def create_model(vocabulary_size,seq_len):
    
    model = Sequential()  
    model.add(Embedding(vocabulary_size,seq_len,imput_length=seq_len)
    mode.add(LSTM(50,return_sequences=True))
    mode.add(LSTM(50)
    mode.add(Dense(50,activation='relu'))
  
    mode.add(Dense(vocabulary_size,activation='softmax'))

    mode.compile(loss='categorical_crossentropy',optimizer='adam',metrics=['accuracy'])

    model.summary()
    return model

Embedding تمثل الطبقة الاولي في النموذج

model=create_model(vocabulary_size+1,seq_len)
from pickle import dump,load
model.fit(X,y,batch_size=128,epochs=2,verbose=1)
model.save('file name.h5')
dump(tokenizer,open('my_tokenizer','wb'))

العودة إلي أدوات لمعالجة اللغات الطبيعية