Neculai Fantanaru

Everything Depends On The Leader

Regex & Python: переводите с помощью beautifulsoup и DeepL только те HTML-теги, которые содержат определенные ключевые слова

On May 05, 2021
, in
Python Scripts Examples by Neculai Fantanaru

Полный код можно просмотреть здесь: https://pastebin.com/NkNM4Dix

Установите Python. Затем установите следующие две библиотеки с помощью интерпретатора командной строки (cmd) в Windows10:

< ! -- HTML generated using hilite.me -->
py- m pip install pydeepl
py -m pip install beautifulsoup4     

Python автоматически переведет следующие HTML-теги с помощью библиотеки googletrans:

< ! -- HTML generated using hilite.me -->
<title>Your Text</title>
<meta name="description" content="Your Text"/>
<p class="text_obisnuit">Your Text</p>
<p class="text_obisnuit2">Your Text</p>

< ! -- HTML-код, созданный с помощью hilite.me -->

КОД: скопируйте и запустите приведенный ниже код в любой программе-интерпретаторе (я использую pyScripter) . Не забудьте изменить путь в строке "files_from_folder". И не забудьте изменить КОД API.

Здесь вы найдете список языков, которые можно перевести: LANG.

Google автоматически определит язык файлов. Все, что вам нужно сделать, это изменить язык, на который вы хотите перевести: destination_language

< ! -- HTML generated using hilite.me -->
from bs4 import BeautifulSoup
from bs4.formatter import HTMLFormatter
import requests
import json
import re
class UnsortedAttributes(HTMLFormatter):
   def attributes(self, tag):
       for k, v in tag.attrs.items():
           yield k, v
files_from_folder = r"c:\Users\Castel\Videos"
use_translate_folder = False
destination_language = 'nl'
extension_file = ".html"
pattern1 = r'<p class="text_obisnuit">.*(( the | you | which | have | had | then | that | must | make | from | else | does | get | will | make | made | yours | can | your | doesn | their | could | from | at | of | my | an | by | with | are | his | him | she | he | it | may | seem | and | for | else | while | which | be | these | let | ask | has | as | won | keep | but | everything | without | thinking | about | just | to | doesn | if | each | try | I'm | them | one | more | much | on | all | even | over | seems ).*){3,}.*</p>'
pattern2 = r'<p class="text_obisnuit2">.*(( the | you | which | have | had | then | that | must | make | from | else | does | get | will | make | made | yours | can | your | doesn | their | could | from | at | of | my | an | by | with | are | his | him | she | he | it | may | seem | and | for | else | while | which | be | these | let | ask | has | as | won | keep | but | everything | without | thinking | about | just | to | doesn | if | each | try | I'm | them | one | more | much | on | all | even | over | seems ).*){3,}.*</p>'
pattern3 = r'<title>.*(( the | you | which | have | had | then | that | must | make | from | else | does | get | will | make | made | yours | can | your | doesn | their | could | from | at | of | my | an | by | with | are | his | him | she | he | it | may | seem | and | for | else | while | which | be | these | let | ask | has | as | won | keep | but | everything | without | thinking | about | just | to | doesn | if | each | try | I'm | them | one | more | much | on | all | even | over | seems ).*){3,}.*</title>'
pattern4 = r'<meta name="description" content=.*(( the | you | which | have | had | then | that | must | make | from | else | does | get | will | make | made | yours | can | your | doesn | their | could | from | at | of | my | an | by | with | are | his | him | she | he | it | may | seem | and | for | else | while | which | be | these | let | ask | has | as | won | keep | but | everything | without | thinking | about | just | to | doesn | if | each | try | I'm | them | one | more | much | on | all | even | over | seems ).*){3,}.*>'
patterns = [pattern1, pattern2, pattern3, pattern4]
import os
directory = os.fsencode(files_from_folder)
def recursively_translate(node):
   for x in range(len(node.contents)):
       if isinstance(node.contents[x], str):
           if node.contents[x].strip() != '':
               try:
                   newtext = requests.post('https://api-free.deepl.com/v2/translate',
                   data={'auth_key':'YOUR-CODE:fx',
                         'text':node.contents[x],
                         'target_lang':destination_language
                         }).content
                   node.contents[x].replaceWith(json.loads(newtext)['translations'][0]['text'])
               except:
                   pass
       elif node.contents[x] != None:
           recursively_translate(node.contents[x])
for file in os.listdir(directory):
   filename = os.fsdecode(file)
   print(filename)
   if filename == 'y_key_e479323ce281e459.html' or filename == 'TS_4fg4_tr78.html':
       continue
   if filename.endswith(extension_file):
       with open(os.path.join(files_from_folder, filename), encoding='utf-8') as html:
           page = html.read()
           updated = False
           for pattern in patterns:
               for x in re.finditer(pattern, page):
                   updated = True
                   new = x.group(0)
                   soup = BeautifulSoup(new, 'html.parser')
                   if pattern != pattern4:
                       recursively_translate(soup)
                   else:
                       meta = soup.find('meta')
                       newtext = requests.post('https://api-free.deepl.com/v2/translate',
                       data={'auth_key':'YOUR-CODE:fx',
                             'text':meta['content'],
                             'target_lang':destination_language
                             }).content
                       meta['content'] = json.loads(newtext)['translations'][0]['text']
                   soup = soup.encode(formatter=UnsortedAttributes()).decode('utf-8')
                   page = page.replace(new, soup)
       if updated:
           print(f'{filename} translated')
           new_filename = f'{filename.split(".")[0]}_{destination_language}.html'
           if use_translate_folder:
               try:
                   with open(os.path.join(files_from_folder+r'\translated', new_filename), 'w', encoding='utf-8') as new_html:
                       new_html.write(page)
               except:
                   os.mkdir(files_from_folder+r'\translated')
                   with open(os.path.join(files_from_folder+r'\translated', new_filename), 'w', encoding='utf-8') as new_html:
                       new_html.write(page)
           else:
               with open(os.path.join(files_from_folder, new_filename), 'w', encoding='utf-8') as html:
                   html.write(page)
      

That's all folks.

If you like my code, then make me a favor: translate your website into Romanian, "ro".

Также ознакомьтесь с этой ВЕРСИЕЙ 2 или ВЕРСИЯ 3 или ВЕРСИЯ 4 или ВЕРСИЯ 5 или ВЕРСИЯ 6 или ВЕРСИЯ 7

Alatura-te Comunitatii Neculai Fantanaru
63 величайших качества лидера
Cele 63 de calităţi ale liderului

Зачем читать эту книгу? Потому что это имеет решающее значение для оптимизации вашей производительности. Потому что раскрывает основные координаты, после чего строят характер и навыки лидеров, подчеркивая, что им важно для повышения своего влияния.

Лидерство – магия мастерства
Atingerea maestrului

Существенной характеристикой этой книги по сравнению с другими книгами, представленными на рынке в той же области, является то, что она описывает на примерах идеальные компетенции лидера. Я никогда не утверждал, что стать хорошим лидером легко, но если люди будут...

Мастерское прикосновение
Leadership - Magia măiestriei

Для некоторых лидеров «руководство» больше напоминает шахматную игру, игру ума и проницательности; для других это означает азартную игру, игру, которую, как они думают, они могут выиграть каждый раз, рискуя и ставя все на одну карту.

Загадка лидерства
Leadership Puzzle

Я написал эту книгу, которая простым способом соединяет личностное развитие с лидерством, как пазл, где нужно соединять все данные кусочки, чтобы составить общий образ.

Руководство
Leadership - Pe înţelesul tuturor

Цель этой книги — предоставить вам информацию на конкретных примерах и показать, как обрести способность заставить других смотреть на вещи под той же точкой зрения, что и вы.

Лидерство для чайников
Leadership - Pe înţelesul tuturor

Не считая это согласием, книга представляет собой попытку обычного человека - автора - который простыми словами, фактами и обычными примерами вселяет в обычного человека смелость и оптимизм в его собственном стремлении быть хозяином самому себе и кто знает. ..может даже лидер.