RECURRENT DONATION
Donate monthly to support
the NeculaiFantanaru.com project
ລັກສະນະທີ່ສໍາຄັນຂອງຫນັງສືເຫຼັ້ມນີ້ໃນການປຽບທຽບກັບຄົນອື່ນໃນຕະຫຼາດໃນໂດເມນດຽວກັນແມ່ນວ່າມັນອະທິບາຍໂດຍຜ່ານຕົວຢ່າງຄວາມສາມາດທີ່ເຫມາະສົມຂອງຜູ້ນໍາ. ຂ້າພະເຈົ້າບໍ່ເຄີຍອ້າງວ່າມັນເປັນການງ່າຍທີ່ຈະເປັນຜູ້ນໍາທີ່ດີ, ແຕ່ຖ້າຫາກວ່າປະຊາຊົນຈະ...
ຂ້າພະເຈົ້າໄດ້ຂຽນຫນັງສືເຫຼັ້ມນີ້ທີ່ປະສົມປະສານກັບການພັດທະນາສ່ວນບຸກຄົນແບບງ່າຍໆກັບການເປັນຜູ້ນໍາ, ຄືກັນກັບການປິດສະຫນາ, ບ່ອນທີ່ທ່ານຕ້ອງຈັບຄູ່ທຸກຊິ້ນທີ່ໃຫ້ມາເພື່ອປະກອບຮູບພາບທົ່ວໄປ.
ຈຸດປະສົງຂອງປຶ້ມຫົວນີ້ແມ່ນເພື່ອສະເຫນີໃຫ້ທ່ານຮູ້ໂດຍຜ່ານຕົວຢ່າງທີ່ຊັດເຈນແລະສະແດງໃຫ້ທ່ານເຫັນວິທີການທີ່ຈະໄດ້ຮັບຄວາມສາມາດທີ່ຈະເຮັດໃຫ້ຄົນອື່ນເຫັນສິ່ງຕ່າງໆຈາກມຸມດຽວກັນກັບທ່ານ.
ທ່ານສາມາດເບິ່ງລະຫັດເຕັມທີ່ນີ້:ພີ້ ຈັດເຂົ້າPython. ຫຼັງຈາກນັ້ນຕິດຕັ້ງຫໍສະຫມຸດສອງຂໍ້ຕໍ່ໄປນີ້ໂດຍໃຊ້ໂປແກຼມ Command Prompt (cmd) (cmd) ເປັນນາຍພາສາໃນ Windows10: py- m pip install unidecode py -m pip install nltk ທ່ານຕ້ອງການດັ່ງຕໍ່ໄປນີ້: 1. ສ້າງໂຟນເດີທີ່ເອີ້ນວ່າ:File_HTML(ໄຟລ໌ຕົວຫນັງສືຈະຖືກບັນທຶກໄວ້ທີ່ນີ້ເປັນ HTML) 2. ສ້າງໂຟນເດີທີ່ເອີ້ນວ່າການເຊື່ອມຕໍ່(ໃນທີ່ນີ້ທ່ານຈະສ້າງ alinksໄຟລ໌ທີ່ທ່ານຕ້ອງໃສ່ພາຍໃຕ້ການເຊື່ອມຕໍ່ html ທີ່ຈະຖືກໃສ່ເປັນຄໍາທີ່ຢູ່ໃນຫນ້າຂອງບົດຄວາມ HTML). 3. ທ່ານຈະຕ້ອງມີເອກະສານ html ດຽວ, ທີ່ເອີ້ນວ່າ:oana.tmmys. ມັນຈະມີໂຄງສ້າງນີ້: <title>Blah Blah Blahtitle> <meta name="description" content="Blah Blah Blah."> <h3 class="font-weight-normal">TITLE OF THE ARTICLEh3> <p>Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.p> 4. ໃນໂຟນເດີທ່ານຈໍາເປັນຕ້ອງໃສ່ທຸກເອກະສານຂໍ້ຄວາມແລະເອກະສານ oana.html WHAT DOES THE CODE DO?: 1. ດຶງເອົາ 10 ຄໍາທໍາອິດຈາກແຕ່ລະເອກະສານຂໍ້ຄວາມແລະບັນທຶກເອກະສານນັ້ນເປັນລິ້ງ HTML ຂອງ 10 ຄໍາ. 2. ດຶງເອົາ 10 ຄໍາທໍາອິດຈາກແຕ່ລະເອກະສານແລະຄັດລອກມັນໃສ່ <ຫົວຂໍ້> Tag ແລະ Tag3. ດຶງເອົາ 20 ຄໍາທໍາອິດຈາກແຕ່ລະເອກະສານຂໍ້ຄວາມແລະຄັດລອກພວກມັນເຂົ້າໃນ tag. 4. ສໍາເນົາເນື້ອໃນທັງຫມົດຂອງເອກະສານຂໍ້ຄວາມເຂົ້າໃນສ່ວນ ມາດຕາເລີ່ມຕົ້ນ.ສິຣະ ລາຍການສຸດທ້າຍ-> (ປ່ຽນແທນຂໍ້ຄວາມທີ່ມີຢູ່ແລ້ວຈາກເອກະສານ HTML) 5. ປ່ຽນຊື່ເອກະສານ HTML ໃຫມ່ຕາມ 10 ຄໍາທໍາອິດໃນເອກະສານຂໍ້ຄວາມ. 6. ກວດເບິ່ງວ່າຄໍາຫລັກຢູ່ໃນລິງທີ່ຕັ້ງຢູ່ໃນlinksເອກະສານແມ່ນຢູ່ໃນຂໍ້ຄວາມ. ຖ້າແມ່ນ, ມັນເລືອກແບບສຸ່ມຈາກຮ່າງກາຍຂອງຫນ້າ HTML ໃຫມ່ແລະເນັ້ນມັນເປັນ link. (ການເຊື່ອມໂຍງຄໍາສັບຕ່າງໆເຊັ່ນ "ແລະ, ໃຜ, ແມ່ນໃຜ, ແມ່ນຫຍັງ, ເວລາ" ຈະຖືກຍົກເວັ້ນເພາະວ່າມັນບໍ່ແມ່ນຄໍາຫລັກ). ລະຫັດ:ສໍາເນົາແລະດໍາເນີນລະຫັດຂ້າງລຸ່ມນີ້ໃນໂປແກຼມນາຍແປພາສາ(ຂ້ອຍໃຊ້ໂຍໂສ. #------------------------------------------------------------------------------- # Name: Create html files from text files # Purpose: # # Author: Neculai Fantanaru # # Created: 22/01/2022 # Copyright: (c) Neculai Fantanaru 2022 #------------------------------------------------------------------------------- import os import re import random import unidecode import nltk from nltk import tokenize # nltk.download('punkt') SITE = 'https://neculaifantanaru.com/' LISTA_CUVINTE_LEGATURA = [ 'in', 'la', 'unei', 'si', 'sa', 'se', 'de', 'prin', 'unde', 'care', 'a', 'al', 'prea', 'lui', 'din', 'ai', 'unui', 'acei', 'un', 'doar', 'tine', 'ale', 'sau', 'dintre', 'intre', 'cu', 'ce', 'va', 'fi', 'este', 'cand', 'o', 'cine', 'aceasta', 'ca', 'dar', 'II', 'III', 'IV', 'V', 'VI', 'VII', 'VIII', 'to', 'was', 'your', 'you', 'is', 'are', 'iar', 'fara', 'asta', 'pe', 'tu', 'nu', 'mai', 'ne', 'le', 'intr', 'cum', 'e', 'for', 'she', 'it', 'esti', 'this', 'that', 'how', 'can', 't', 'must', 'be', 'the', 'and', 'do', 'so', 'or', 'ori', 'who', 'what', 'if', 'of', 'on', 'i', 'we', 'they', 'them', 'but', 'where', 'by', 'an', 'mi', '1', '2', '3', '4', '5', '6', '7', '8', '9', '0', 'made', 'my', 'me', '-', 'vom', 'voi', 'ei', 'cat', 'ar', 'putea', 'poti', 'sunteti', 'inca', 'still', 'noi', 'l', 'ma', 's', 'dupa', 'after', 'under', 'sub', 'niste', 'some', 'those', 'he', 'no', 'too', 'fac', 'made', 'make', 'cei', 'most', 'face', 'pentru', 'cat', 'cate', 'much', 'more', 'many', 'sale', 'tale', 'tau', 'has', 'sunt', 'his', 'yours', 'only', 'as', 'toate', 'all', 'tot', 'incat', 'which', 'ti', 'asa', 'like', 'these', 'because', 'unor', 'caci', 'ele', 'have', 'haven', 'te', 'cea', 'else', 'imi', 'iti', 'should', 'could', 'not', 'even', 'chiar', 'when', 'ci', 'ne', 'ni', 'her', 'our', 'alta', 'another', 'other', 'decat', 'acelasi', 'same', 'au', 'had', 'haven', 'hasn', 'alte', 'alt', 'others', 'ceea', 'cel', 'cele', 'alte', 'despre', 'about', 'acele', 'acel', 'acea', 'decit', 'with', '_', 'fata', 'towards', 'against', 'cind', 'dinspre', 'fost', 'been', 'era' ] PATTERN_LINK = "\"{}\" target=\"_new\">{}" ''' structura dictionar cuvinte { "cuvantul1": [lista_linkuri1], "cuvantul2": [lista_linkuri2] } ''' CALE_FISIER_LINKURI = "C:\\Folder1\\LINKS\\links.txt" # folosim DEF cand vrem sa definim o functie => un cuvant cheie in Python # REGULA: def nume_functie(lista_argumente) def preia_cuvinte_link(link): cuvinte = link.split('.')[0] # [0] ia primul element iar daca pun [1] ia al doilea element cuvinte = cuvinte.split('-') cuvinte_ok = list() for cuv in cuvinte: if cuv not in LISTA_CUVINTE_LEGATURA: cuvinte_ok.append(cuv) return cuvinte_ok # am pus retutn fiindca voi avea nevoie de rezultatul functiei de mai sus def preia_cuvinte_lista_linkuri(cale_fisier_linkuri): lista_cuvinte_linkuri = list() dictionar_cuvinte_linkuri = dict() with open(cale_fisier_linkuri, encoding='utf8') as fp: lines = fp.readlines() for line in lines: # functia preia_cuvinte_link returneaza un rezultat care este salvat in variabila cuvinte_link cuvinte_link = preia_cuvinte_link(line) for cuv in cuvinte_link: if cuv in dictionar_cuvinte_linkuri.keys(): if not SITE + line.strip() in dictionar_cuvinte_linkuri[cuv]: dictionar_cuvinte_linkuri[cuv].append(SITE + line.strip()) else: dictionar_cuvinte_linkuri[cuv] = [SITE + line.strip()] lista_cuvinte_linkuri.extend(cuvinte_link) lista_cuvinte_linkuri = list(set(lista_cuvinte_linkuri)) return lista_cuvinte_linkuri, dictionar_cuvinte_linkuri def citeste_fisier_linie_cu_linie(cale_fisier): with open(cale_fisier, encoding='utf8') as fp: lines = fp.readlines() count = 0 for line in lines: print(count, line.strip()) count += 1 def read_text_from_file(file_path): """ Aceasta functie returneaza continutul unui fisier. file_path: calea catre fisierul din care vrei sa citesti """ with open(file_path, encoding='utf8') as f: text = f.read() return text def write_to_file(text, file_path): """ Aceasta functie scrie un text intr-un fisier. text: textul pe care vrei sa il scrii file_path: calea catre fisierul in care vrei sa scrii """ with open(file_path, 'wb') as f: f.write(text.encode('utf8', 'ignore')) def split_propozitii(text): # 01.02.2022: folosit librarie pentru extragerea propozitiilor propozitii = tokenize.sent_tokenize(text) # 01.02.2022: scoatem spatiile in plus de la inceputul/finalul propozitiilor si facem prima litera mare propozitii = [prop.strip().capitalize() for prop in propozitii] # 01.02.2022: scot spatiile in plus de la final de propozitie. De exemplu: "ana are mere ?" => "ana are mere?" propozitii = [prop[:-1].strip() + prop[-1] for prop in propozitii] # 31.01.2022: modificat tag-ul p si adaugat css (4) tag = " That's all folks. Latest articles accessed by readers:
Donate via Paypal
RECURRENT DONATIONDonate monthly to support SINGLE DONATIONDonate the desired amount to support Donate by Bank TransferAccount Ron: RO34INGB0000999900448439
Open account at ING Bank
|
||||||||||||
![]() |
||||||||||||