Разбор Python: как скопировать раздел данных из одного HTML-файла в Другие HTML-файлы

Name: Анализ Python: как скопировать раздел данных из одного HTML-файла в другие HTML-файлы
Brand: Neculai Fantanaru
SKU: NFL
Availability: OnlineOnly
Rating: 5 (55 reviews)

June 20, 2021

, in

Python Scripts Examples by Neculai Fantanaru

Полный код можно просмотреть здесь: https://pastebin.com/awhXMcG3.

Следующие теги должны присутствовать как в html-файле в папке A, так и в других html-файлах в папке B. Код Python будет анализировать следующие теги:

<title></title>, <meta name=" описание" content=" "/>, все из <!-- НАЧАЛО СТАТЬИ -->< /span> до <!-- СТАТЬЯ ЗАКЛЮЧИТЕЛЬНАЯ -->, все из <!-- FLAGS_1 --> до <!-- ФЛАГИ -->, все из < !-- НАЧАЛО МЕНЮ --> до <!-- ЗАКЛЮЧИТЕЛЬНОЕ МЕНЮ -->

Это структура файлов. Оба файла в папке А должны иметь одинаковые теги html и, соответственно, одинаковые разделы с комментариями. Из html-файла в папке А все эти разделы будут скопированы в файлы в папке Б.

Important: The content of the tags and the content of the comments (Text Text) are different in the file in Folder A compared to the html files in Folder B. This is also the idea. I want the contents of these tags in Folder A to replace the contents of the same tags in the files in Folder B.

E.g. From the example.html file (from Folder A) the following sections will be copied to the one.html and two.html files (from Folder B)

<title>YOUR FIRST PAGE</title>
<meta name="description" content="I LOVE HTML and CSS"/>
<!-- ARTICLE START -->
Text Text
<!-- ARTICLE FINAL -->
<!-- FLAGS_1 -->
Text Text
<!-- FLAGS -->
<!-- MENU START -->
Text Text
<!-- MENU FINAL -->

Код Python:

import requests
import re
# The folder that contains the file you want to parse
english_folder1 = r"d:\Downloads\A"
# The folder with the files you want to change
english_folder2 = r"d:\Downloads\B"
# The file you want to make parsing
file_to_parse_from = 'example.html'
extension_file = ".html"
use_parse_folder = True
import os
en1_directory = os.fsencode(english_folder1)
en2_directory = os.fsencode(english_folder2)
print('Going through english folder')
for file in os.listdir(en2_directory):
   filename = os.fsdecode(file)
   print(filename)
   if filename == 'y_key_e479323ce281e459.html' or filename == 'directory.html':
       continue
   if filename.endswith(extension_file):
       with open(os.path.join(english_folder1, file_to_parse_from), encoding='utf-8') as html:
           html = html.read()
           try:
               with open(os.path.join(english_folder2, filename), encoding='utf-8') as en_html:
                   en_html = en_html.read()
                   
                   title = re.search('<title.+/title>', html)[0]
                   meta = re.search('<meta name="description".+>', html)[0]
                   comment_body = re.search('<!-- ARTICLE START -->.+<!-- ARTICLE FINAL -->', html, flags=re.DOTALL)[0]
                   try:
                       comment_body2 = re.search('<!-- FLAGS_1 -->.+<!-- FLAGS -->', html, flags=re.DOTALL)[0]
                       en_html = re.sub('<!-- FLAGS_1 -->.+<!-- FLAGS -->', comment_body2, en_html, flags=re.DOTALL)
                   except:
                       pass
                   try:
                       comment_body3 = re.search('<!-- MENU START -->.+<!-- MENU FINAL -->', html, flags=re.DOTALL)[0]
                       en_html = re.sub('<!-- MENU START -->.+<!-- MENU FINAL -->', comment_body3, en_html, flags=re.DOTALL)
                   except:
                       pass
                   
                   en_html = re.sub('<!-- ARTICLE START -->.+<!-- ARTICLE FINAL -->', comment_body, en_html, flags=re.DOTALL)
                   en_html = re.sub('<meta name="description".+>', meta, en_html)
                   en_html = re.sub('<title.+/title>', title, en_html)
           except FileNotFoundError:
               continue
       print(f'{filename} parsed')
       if use_parse_folder:
           try:
               with open(os.path.join(english_folder2+r'\parsed', 'parsed_'+filename), 'w', encoding='utf-8') as new_html:
                   new_html.write(en_html)
           except:
               os.mkdir(english_folder2+r'\parsed')
               with open(os.path.join(english_folder2+r'\parsed', 'parsed_'+filename), 'w', encoding='utf-8') as new_html:
                   new_html.write(en_html)
       else:
           with open(os.path.join(english_folder2, 'parsed_'+filename), 'w', encoding='utf-8') as html:
               html.write(en_html)

That's all folks.

If you like my code, then make me a favor: translate your website into Romanian, "ro".

Также ознакомьтесь с этой ВЕРСИЕЙ 2 или ВЕРСИЯ 3 или ВЕРСИЯ 4 или ВЕРСИЯ 5 или ВЕРСИЯ 6 или ВЕРСИЯ 7

Alatura-te Comunitatii Neculai Fantanaru

63 величайших качества лидера

Зачем читать эту книгу? Потому что это имеет решающее значение для оптимизации вашей производительности. Потому что раскрывает основные координаты, после чего строят характер и навыки лидеров, подчеркивая, что им важно для повышения своего влияния.

Лидерство – магия мастерства

Существенной характеристикой этой книги по сравнению с другими книгами, представленными на рынке в той же области, является то, что она описывает на примерах идеальные компетенции лидера. Я никогда не утверждал, что стать хорошим лидером легко, но если люди будут...

Мастерское прикосновение

Для некоторых лидеров «руководство» больше напоминает шахматную игру, игру ума и проницательности; для других это означает азартную игру, игру, которую, как они думают, они могут выиграть каждый раз, рискуя и ставя все на одну карту.

Загадка лидерства

Я написал эту книгу, которая простым способом соединяет личностное развитие с лидерством, как пазл, где нужно соединять все данные кусочки, чтобы составить общий образ.

Руководство

Цель этой книги — предоставить вам информацию на конкретных примерах и показать, как обрести способность заставить других смотреть на вещи под той же точкой зрения, что и вы.

Лидерство для чайников

Не считая это согласием, книга представляет собой попытку обычного человека - автора - который простыми словами, фактами и обычными примерами вселяет в обычного человека смелость и оптимизм в его собственном стремлении быть хозяином самому себе и кто знает. ..может даже лидер.