Использование Pandas read_table со списком файлов

Я довольно новичок в Python в целом, но пытаюсь создать сценарий, который берет данные из определенных файлов в папке и помещает их в электронную таблицу Excel.

Код, который у меня есть, найдет тип файла, который я хочу в указанной папке, а затем создайте список с полными файловыми путями.

import os file_paths = [] for folder, subs, files in os.walk('C://Users/Dir'): for filename in files: if filename.endswith(".log") or filename.endswith(".txt"): file_paths.append(os.path.abspath(os.path.join(folder,filename))) 

Он также примет определенный путь к файлу, вытащит данные из правильного столбца и поместит его в excel в правильные ячейки.

 import pandas as pd import numpy for i in range(len(file_paths)): fields = ['RDCR'] data = pd.read_table(file_paths[i], sep= "\s+", names = fields, usecols=[3], 

Там, где у меня возникают проблемы, вы делаете read_table итерацией по моему списку файлов и помещаете данные в лист Excel, где каждый раз, когда он читает новый файл, он перемещается по одному столбцу в электронной таблице.

В идеале цикл for будет видеть, как долго находится список файлов_пакетов, и использовать это как диапазон. Затем он будет использовать file_paths [i] для ввода имен файлов в read_table один за другим.

Что происходит, так это то, что он находит длину файлов_пакетов, и вместо того, чтобы перебирать файлы в нем один за другим, он просто вводит данные из последнего файла в списке.

Любая помощь приветствуется! Спасибо!

Попытайтесь объединить их всех сразу и написать, чтобы преуспеть один раз.

 from glob import glob import pandas as pd files = glob('C://Users/Dir/*.log') + glob('C://Users/Dir/*.txt') def read_file(f): fields = ['RDCR'] return pd.read_table( f, sep="\s+", names=fields, usecols=[3]) df = pd.concat([read_file(f) for f in files], axis=1).to_excel('out.xlsx') 
  • Python для итерации по листам и отбрасывания столбцов
  • Как вставить фреймворк в Excel с помощью xlwings без pywintypes.com_error?
  • Как экспортировать несколько сводных таблиц из python с помощью pandas в один документ csv?
  • Извлечение свойств объединенных ячеек при чтении файла excel в панды
  • Pandas fromat column несколько листов
  • Изменение структуры данных в пандах
  • Как сохранить в * .xlsx длинный URL-адрес в ячейке с помощью Pandas
  • Создание нескольких книг из столбца или поля
  • Используя py2exe для создания окон exe, но у него, похоже, проблема с моим скриптом, - объект pandas \ io \ excel.pyc не имеет версии атрибута
  • Объединение двух данных таблицы Excel (бок о бок)
  • Изменить столбец в df из столбца из другого
  • Давайте будем гением компьютера.