Bakalarska_praca/data_files/csv_create.py

31 lines
1.4 KiB
Python
Raw Normal View History

2024-10-23 11:43:55 +00:00
import csv
# Открываем файлы с правильными и неправильными строками
with open('slovak_no_caps.txt', 'r', encoding='utf-8', errors='replace') as correct_file:
correct_lines = correct_file.readlines()
with open('no_slovak_no_caps.txt', 'r', encoding='utf-8', errors='replace') as incorrect_file:
incorrect_lines = incorrect_file.readlines()
# Убедимся, что оба списка строк имеют одинаковую длину
max_length = max(len(correct_lines), len(incorrect_lines))
# Дополняем более короткий список пустыми строками, если это необходимо
correct_lines += [''] * (max_length - len(correct_lines))
incorrect_lines += [''] * (max_length - len(incorrect_lines))
# Открываем CSV файл для записи
with open('dataset.csv', 'w', newline='', encoding='utf-8') as csvfile:
fieldnames = ['correct', 'incorrect']
writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
# Записываем заголовок
writer.writeheader()
# Записываем строки в CSV файл
for correct_line, incorrect_line in zip(correct_lines, incorrect_lines):
writer.writerow({'correct': correct_line.strip(), 'incorrect': incorrect_line.strip()})
print("CSV файл успешно создан!")