بسم الله الرحمن الرحيم

إستخراج نصوص ملف PDF مكتوبة باللغة العربية

تاريخ النشر : May 21, 2022

None


import arabic_reshaper
import pdfplumber
from bidi.algorithm import get_display
ar_file=  pdfplumber.open(r'01.pdf')
my_page=ar_file.pages[10]
thepages=my_page.extract_text()
reshaped_text = arabic_reshaper.reshape(thepages)
bidi_text = get_display(reshaped_text)
print(bidi_text)
لتحويل لملف صوتي
var=gTTS(bidi_text,lang='ar')
var.save('.\lang.mp3')

العودة إلي لغة البرمجة البايثون Python