Трудности манипуляции с таблицами с Pandas Pandas

Я даю себе крутой курс использования python и pandas для хруста данных. Я, наконец, устал от использования электронных таблиц и хотел чего-то более гибкого, чем R, поэтому я решил отбросить это. Это действительно гладкий интерфейс, и у меня с ним вспыхивает взрыв. Однако, исследуя различные трюки, я не смог найти только чит-лист основных функций электронных таблиц, особенно в отношении добавления формул к новым столбцам в кадрах данных, которые ссылаются на другие столбцы.

Мне было интересно, может ли кто-нибудь дать мне рекомендованный код для выполнения шести стандартных операций с электронными таблицами ниже, чтобы я мог лучше понять, как это работает. Если вы хотите увидеть полноразмерный рендеринг изображения, просто нажмите здесь.

Пример таблицы Pandas

Если вы хотите увидеть таблицу для себя, нажмите здесь .

Я уже немного знаком с добавлением столбцов в dataframes, это в основном перекрестная ссылка на конкретные ячейки, с которыми я борюсь. В принципе, я ожидаю, что ответ будет выглядеть примерно так:

table['NewColumn']=(table['given_column']+magic-code-that-I-don't-know).astype(float-or-int-or-whatever) 

Если мне будет полезно использовать дополнительную библиотеку для выполнения любой из этих функций, не стесняйтесь предлагать ее.

Спасибо заранее.

В общем, вы хотите думать о векторизованных операциях над столбцами вместо операций над конкретными ячейками.

Например, если у вас есть столбец data , и вы хотите, чтобы другой столбец был тем же, но с каждым значением, умноженным на 3, вы могли бы сделать это двумя основными способами. Первая – операция «по ячейке».

 df['data_prime'] = df['data'].apply(lambda x: 3*x) 

Второй – это векторизованный способ:

 df['data_prime'] = df['data'] * 3 

Итак, столбец по столбцу в вашей таблице:

Count (вы можете добавить 1 к правой стороне, если хотите, чтобы она начиналась с 1 вместо 0):

 df['count'] = pandas.Series(range(len(df)) 

Общая сумма :

 df['running total'] = df['data'].cumsum() 

Отличие от скаляра (установите скаляр в определенное значение в вашем df, если хотите):

 df['diff'] = scalar - df['data'] 

Скользящее среднее :

 df['moving average'] = df['running total'] / df['count'].astype('float') 

Основная формула из вашей таблицы :

Думаю, вам этого достаточно, по своему усмотрению.

Если утверждение :

 df['new column'] = 0 mask = df['data column'] >= 3 df.loc[mask, 'new column'] = 1 
  • Добавление нового столбца pandas с отображаемым значением из словаря
  • python pandas не работает
  • Организация данных, считываемых из Excel в Pandas DataFrame
  • как сохранить строку в формате «utf-8» в .xlsx, используя pandas to_exel (to_csv может сохранить его как .csv)
  • Что было бы элегантным решением для управления и получения данных из нескольких файлов excel
  • Создание информационных кадров с одного листа в пандах
  • «Unsparsify» мультииндекс pandas при записи в Excel
  • Pandas Excel Writer с использованием Openpyxl с существующей книгой
  • Объединение данных в разных столбцах в один столбец (pandas, python)
  • Условное форматирование для частичных дубликатов в Pandas и Excel
  • Группа данных Pandas Excel по столбцу и диаграмме График рассеяния со средним значением
  • Interesting Posts

    Сообщение об ошибке AFRACT (#VALUE!) Для JON49`s to Как преобразовать hh: mm: ss.000 в миллисекунды в Excel?

    Высота автоподготовки на обеих колонках: колонка с объединенными ячейками и колонка с одиночными ячейками

    Excel Тип конвертации даты: 22 июля 2015 года до 22/07/2015

    Как создать прейскурант списка, отфильтрованный с последним измененным столбцом в Dynamics-NAV

    VBA Excel – Loop, основанный на значении диапазона ячеек

    Лучшее обоих миров

    Как найти последнее число (в строке) для определенной переменной, используя excel

    Excel VBA продолжает «Открыть файл» даже после отмены

    Формат пользовательского номера с пустыми частями?

    Добавить знак фунта в формулу в Excel

    Как скопировать строки в excel с помощью VBA и сохранить XML-сопоставление?

    Отличная проверка входных данных в Excel VBA

    Время выполнения Open XML вместо SDK

    Класс STSheetViewType отсутствует в poi-ooxml-schemas-3.14 JAR

    Индекс / совпадение диапазонов дат

    Давайте будем гением компьютера.