Name: Python: найти все файлы, содержащие двойные слова (строку или число)
Brand: Neculai Fantanaru
SKU: NFL
Availability: OnlineOnly
Rating: 5 (55 reviews)

Python: найти все файлы, содержащие двойные слова (строки или числа)

On February 28, 2022

, in

Python Scripts Examples by Neculai Fantanaru

Полный код можно просмотреть здесь: https://pastebin.com/YNCWi580

Установите Python. Что делает приведенный ниже код?

В каждом html-файле у меня есть последовательность php, содержащая эту переменную < ! -- $item_id = НОМЕР;

Число равно диапазону от 1 до 1600 (или до того числа, которое вы хотите). Например, в файле может быть < ! -- $item_id = < ! -- HTML-код, созданный с помощью hilite.me -->23;, а в другом файле я могу иметь < ! -- $item_id = 1340; И так далее..

Я хочу найти те файлы, которые содержат повторяющиеся числа в строке. Например, я могу иметь 23; n файл и может иметь одинаковый 23; в другом файле. Код Python сохранит в results_dudicates.txt все имена файлов, содержащие дубликаты этого типа.

CODUL: скопируйте и запустите приведенный ниже код в любой программе-интерпретаторе (я использую pyScripter) .

Код:

import os
import re
def read_text_from_file(file_path):
   """
    Aceasta functie returneaza continutul unui fisier.
    file_path: calea catre fisierul din care vrei sa citesti
    """
   with open(file_path, encoding='utf8', errors='ignore') as f:
       text = f.read()
       return text
def write_to_file(text, file_path, encoding='utf8'):
   """
    Aceasta functie scrie un text intr-un fisier.
    text: textul pe care vrei sa il scrii
    file_path: calea catre fisierul in care vrei sa scrii
    """
   with open(file_path, 'wb') as f:
       f.write(text.encode('utf-8', 'ignore'))
def get_duplicates(directory_path, results_file, tag):
   duplicates = dict()
   fisiere_care_nu_au_id = ''
   fisiere_duplicat = ''
   id_pattern = re.compile('\$item_id = (.*?);')
   for f in os.listdir(directory_path):
           if f.endswith('.html') and f != 'termeni-si-conditii.html' and f != "parteneri.html":
               filepath = directory_path + '//' + f
               file_text = read_text_from_file(filepath)
               number = re.findall(id_pattern, file_text)
               if len(number) != 0:
                   number = number[0]
                   number = number.strip()
                   if number in duplicates.keys():
                       duplicates[number].append(f)
                   else:
                       duplicates[number] = [f]
               else:
                   fisiere_care_nu_au_id = fisiere_care_nu_au_id + f + '\n'
   for key in duplicates.keys():
       if len(duplicates[key]) >= 2:
           for f in duplicates[key]:
               fisiere_duplicat = fisiere_duplicat + f + '\n'
           fisiere_duplicat += '\n\n'
   # i-au toate numerele din intervalul 1 - id maxim
   # modificare in numere intregi
   numere_intregi = [int(i) for i in list(duplicates.keys())]
   interval = list()
   if tag == 'ro':
       interval = [i for i in range(1, max(numere_intregi) + 1)]
   elif tag == 'en':
       interval = [i for i in range(5000, max(numere_intregi) + 1)]
   numere_care_lipsesc = list()
   for number in interval:
       if number not in numere_intregi:
           numere_care_lipsesc.append(number)
   print("MAX: ", max(numere_intregi))
   print("NUMERE CARE LIPSESC: ", numere_care_lipsesc)
   fisiere_care_lipsesc_id = ''
   for numar in numere_care_lipsesc:
       fisiere_care_lipsesc_id = fisiere_care_lipsesc_id + str(numar) + '\n'
   result = "FISIERE CARE NU AU ID \n\n" + fisiere_care_nu_au_id + '\n' + "FISIERE DUPLICAT \n\n" + fisiere_duplicat  + '\n' + "NUMERE CARE LIPSESC \n\n" + fisiere_care_lipsesc_id
   write_to_file(result, results_file)
   print("Scriere efectuata cu succes.")
if __name__ == '__main__':
   directory_path = "e:\\Carte\\BB\\17 - Site Leadership\\Principal\\en"   # AICI SCHIMB PATCH cu ro sau cu en
   results_file = "e:\\Carte\\BB\\17 - Site Leadership\\Principal\\ro\\results_duplicates.txt"  # AICI APAR REZULTATELE FINALE
   get_duplicates(directory_path, results_file, "en") # "ro"  # AICI SCHIMB PATCH cu ro sau cu en  (SCHIMBA SI MAI SUS )

That's all folks.

If you like my code, then make me a favor: translate your website into Romanian, "ro".

Также ознакомьтесь с этой ВЕРСИЕЙ 2 или ВЕРСИЯ 3 или ВЕРСИЯ 4 или ВЕРСИЯ 5 или ВЕРСИЯ 6 или ВЕРСИЯ 7

Alatura-te Comunitatii Neculai Fantanaru

63 величайших качества лидера

Зачем читать эту книгу? Потому что это имеет решающее значение для оптимизации вашей производительности. Потому что раскрывает основные координаты, после чего строят характер и навыки лидеров, подчеркивая, что им важно для повышения своего влияния.

Лидерство – магия мастерства

Существенной характеристикой этой книги по сравнению с другими книгами, представленными на рынке в той же области, является то, что она описывает на примерах идеальные компетенции лидера. Я никогда не утверждал, что стать хорошим лидером легко, но если люди будут...

Мастерское прикосновение

Для некоторых лидеров «руководство» больше напоминает шахматную игру, игру ума и проницательности; для других это означает азартную игру, игру, которую, как они думают, они могут выиграть каждый раз, рискуя и ставя все на одну карту.

Загадка лидерства

Я написал эту книгу, которая простым способом соединяет личностное развитие с лидерством, как пазл, где нужно соединять все данные кусочки, чтобы составить общий образ.

Руководство

Цель этой книги — предоставить вам информацию на конкретных примерах и показать, как обрести способность заставить других смотреть на вещи под той же точкой зрения, что и вы.

Лидерство для чайников

Не считая это согласием, книга представляет собой попытку обычного человека - автора - который простыми словами, фактами и обычными примерами вселяет в обычного человека смелость и оптимизм в его собственном стремлении быть хозяином самому себе и кто знает. ..может даже лидер.