Публикации по теме 'pandas'
Как я заработал 500 долларов на простом концерте с пакетом Pandas
Мой опыт высокооплачиваемой быстрой работы, включающей только пакет pandas Python.
У меня есть клиент, который отслеживает просроченные счета. Он хочет добавить примечания к мастер-файлу, прочитать новый входной файл, и если номер счета-фактуры не указан в новом входе, что является признаком платежа, он хочет, чтобы эти строки были удалены из мастер-файла. Ему не нужно отслеживать эти счета, потому что они уже оплачены.
Я представлю код здесь, поскольку я построил процесс в блокноте..
Пришло время попрощаться с pd.read_csv() и pd.to_csv()
Обсуждение еще одного важного предостережения Pandas
Операции ввода-вывода с Pandas в CSV сериализованы, что делает их невероятно неэффективными и трудоемкими. Это расстраивает, когда я вижу здесь широкие возможности для распараллеливания, но, к сожалению, Pandas не предоставляет эту функциональность (пока). Хотя я никогда не поддерживаю создание CSV в первую очередь с помощью Pandas (прочитайте мой пост ниже, чтобы узнать, почему), я понимаю, что могут быть ситуации, когда у вас нет..
Используйте фреймы данных Pandas более эффективно с помощью 7 основных операций со столбцами
Полное руководство по выполнению 7 лучших операций столбца Pandas разными способами.
Когда дело доходит до анализа данных, Pandas является наиболее используемой библиотекой Python для обработки и подготовки данных для дальнейшего анализа и машинного обучения.
Реальность такова, что Pandas — действительно гибкая библиотека, которую можно использовать даже для преобразования форматов файлов .
Однако, даже если мы используем некоторые функции Pandas едва ли каждый день, мы тратим..
Панды для данных: Code Challenge
Python пятница # 4
Оценив свои запланированные проекты, я обнаружил, что большинство из них связано с генерированием, сбором и анализом данных. В таком случае я провел кучу поисков в Интернете и нашел этот сайт под названием Data Quest .
Data Quest - это потрясающе!
Я только заканчиваю свой первый курс, но пока это был отличный опыт. Это то, что заставило меня возиться с пандами 🐼 И я понял, что мне нужно иметь глубокое понимание того, как использовать панды, чтобы делать..
Руководство по масштабированию Pandas
Панды14 Запад 20238
Примечание редактора: Дорис Ли выступает докладчиком на ODSC West с 30 октября по 2 ноября. Обязательно ознакомьтесь с ее докладом Масштабирование рабочих процессов обработки данных путем изменения одной строки кода здесь!
pandas сегодня является одной из самых популярных библиотек обработки и анализа данных. Согласно недавнему опросу StackOverflow , его использует каждый четвертый разработчик. Это также де-факто библиотека по науке о данных,..
Вопросы по теме 'pandas'
добавить результаты pandas.DataFrame.GroupBy в другой кадр данных
Я анализирую базу данных google ngram, которую можно скачать здесь: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
Это файл, разделенный табуляцией. У него нет заголовка, и данные выглядят так.
financial analysis 2000...
24.03.2024
Pandas дважды зацикливается при применении функции к строке csv python
У меня есть CSV-документ со столбцом «IP-адрес» и тремя другими столбцами со случайными данными. Моя цель — пройтись по столбцу IP-адреса и запустить bulkfunc для каждого IP-адреса, выводя содержимое в текстовый файл.
У меня панда правильно...
07.04.2024
Seaborn tsplot не показывает данные
Я пытаюсь использовать seaborn для создания простого tsplot, но по непонятным мне причинам ничего не появляется, когда я запускаю код. Вот минимальный пример:
import numpy as np
import seaborn as sns
import pandas as pd
df =...
30.03.2024
Чтение одной «ячейки» таблицы фиксированной ширины (файл .txt), которая разделена на две строки в python/pandas
Как прочитать одну «ячейку» столбца фиксированной ширины, разделенную на две строки? Ввод данных представляет собой таблицу фиксированной ширины, например;
ID Description QTY
1 Description split over 1
two lines
2...
10.04.2024
Панды - Кончают за периоды времени + группа по времени
В настоящее время у меня есть фрейм данных, который выглядит так:
Я пытаюсь понять, как это сделать, и просто не знаю, с чего начать ...
За каждый ДЕНЬ накапливайте объем ..
После этого сгруппируйте данные по времени суток (т. Е. С...
12.05.2024
отображение панд: усекать отображение столбца, а не обертывать
С длинными именами столбцов DataFrames будут отображаться в очень запутанной форме, по-видимому, независимо от того, какие опции установлены.
Информация: я нахожусь в Jupyter QtConsole, pandas 0.20.1, со следующими соответствующими параметрами,...
28.04.2024
Операция Python tkinter для передачи значения из текстового поля
На самом деле я сделал скрипт для работы с .docx. Этот сценарий будет подсчитывать общее количество файлов .docx в папке и давать некоторые отчеты. Теперь я планирую использовать для этого операцию с графическим интерфейсом. В моем сценарии я...
18.04.2024
Кодирование строковых функций в pandas
У меня есть кадр данных, как показано ниже
train_df
'type', 'manufacturer', 'year', 'num_doors'
sedan, bmw, 2012, 4
couple, audi, 2014, 2
and so on
и test_df в аналогичном формате. Все функции являются категориальными функциями (некоторые...
18.04.2024
pyinstaller и pandas (отсутствует несколько хуков)
Раньше у меня этот хук отсутствовал pandas._libs.tslibs.np_datetime . Я просмотрел эту статью здесь и исправил это.
Теперь, когда я создал файл .exe с помощью pyinstaller, он показывает отсутствие другого хука pandas._libs.tslibs.nattype . Я...
12.05.2024
Как переименовать столбцы, чтобы получить одну строку имен столбцов?
У меня есть этот pandas DataFrame df :
дф.голова()
windIntensity year month day hour AOBT delay
3 2015 1 1 0 0 0.0 15.0
2 2015 1 1 0 0 0.0 10.0
2 2015...
06.04.2024
Операнды не могли транслироваться вместе
Я пытаюсь обучить модель с помощью мини-пакетов, но у меня возникает .... ошибка.
Я использую ту же функцию, которую уже использовал (и она работала) с другими моделями, но на этот раз происходит сбой.
def random_mini_batches(X, Y,...
22.04.2024
Найдите ближайшее значение из нескольких столбцов и добавьте в новый столбец в Python
У меня есть следующий фрейм данных:
import pandas as pd
import numpy as np
data = {
"index": [1, 2, 3, 4, 5],
"A": [11, 17, 5, 9, 10],
"B": [8, 6, 16, 17, 9],
"C": [10, 17, 12, 13, 15],
"target": [12, 13, 8, 6, 12]
}
df =...
17.04.2024
Расчет частоты реадмиссии
Я новичок в Python и пытаюсь рассчитать, был ли пациент повторно госпитализирован в течение 30 дней или нет.
Данные представлены в виде кадра данных Pandas со столбцами для идентификатора пациента, даты прибытия, даты отъезда и статуса (выписан,...
16.04.2024
как изменить числовые данные на текст в графике панд?
У меня есть две полосы, которые я построил из столбца csv. Имя столбца — «пол», а значения — 0 для мужчин и 1 для женщин. это мой код:
df = pd.read_csv("file.csv")
df['sex'].value_counts().plot(kind='bar')
plt.show()
Я хочу, чтобы вместо 0...
03.05.2024
Панды удаляют дубликаты между группами
У меня есть кадр данных, в котором я хотел бы удалить дубликаты только между группами.
A B C D
0 1 0 2 Group 1
1 1 1 1 Group 2
2 1 1 1 Group 2
3 1 1 1 Group 2
4 3 8 3 Group 2
5 3 8 3 Group 1
6 2 9 1 Group 2
7...
13.05.2024
Может ли `to_datetime` Pandas анализировать даты BCE?
Учитывая дату вроде 8300 г. до н.э., я запускаю pd.to_datetime("-8300", format="%y") .
Это производит ValueError: time data '-8300' does not match format '%y' (match) .
Есть ли способ обрабатывать отрицательные даты в Pandas?
05.04.2024
Как построить матрицу инцидентности из двух столбцов фрейма данных, используя scipy.sparse.coo_matrix((data, (i, j)))?
У меня есть пандас DataFrame, содержащий два столбца ['A', 'B']. Каждый столбец состоит из целых чисел.
Я хочу построить разреженную матрицу со следующими свойствами:
индекс строки - это все целые числа от 0 до максимального значения в кадре...
07.03.2024
стиль pandas не отображается для всех строк в больших фреймах данных в Chrome или Edge
Update:
Похоже, проблема связана с отображением HTML со стилем, отображаемым пандами в Google Chrome и Microsoft Edge.
JupyterLab в Firefox правильно отображает все стилизованные строки и корректно отображает выходной HTML-файл....
01.04.2024
Преобразование многомерного массива климатических данных в фрейм данных Pandas
Я хочу преобразовать многомерные климатические данные в фрейм данных pandas. Форма моего массива numpy - temperature.shape -> (365,100,200) -> ["time", "longitude", "latitude"] . Затем я хотел бы иметь следующие...
03.04.2024
Новые материалы
Основы Spring: Bean-компоненты, контейнер и внедрение зависимостей
Как лего может помочь нашему пониманию
Когда мы начинаем использовать Spring, нам бросают много терминов, и может быть трудно понять, что они все означают.
Итак, мы разберем основы и будем..
Отслеживание состояния с течением времени с дифференцированием снимков
Время от времени что-то происходит и революционизирует часть моего рабочего процесса разработки. Что-то более забавное вместо типичного утомительного и утомительного процесса разработки. В..
Я предполагаю, что вы имеете в виду методы обработки категориальных данных.
Я предполагаю, что вы имеете в виду методы обработки категориальных данных. Пожалуйста, проверьте мой пост Инструментарий специалиста по данным для кодирования категориальных переменных в..
Игра в прятки с данными
Игра в прятки с данными
Я хотел бы, чтобы вы сделали мне одолжение и ответили на следующие вопросы. Гуглить можно в любое время, здесь никто не забивается.
Сколько регионов в Гане?
А как..
«Раскрытие математических рассуждений с помощью Microsoft MathPrompter и моделей больших языков»
TL;DR:
MathPrompter от Microsoft показывает, как использовать математические рассуждения с большими языковыми моделями; 4-этапный процесс для улучшения доверия и рассуждений в математических..
Раскройте свой потенциал в области разработки мобильных приложений: Абсолютная бесплатная серия
Глава 6: Работа в сети и выборка данных
Глава 1: Введение в React Native Глава 2: Основы React Native Глава 3: Создание пользовательского интерфейса с помощью React Native Глава 4:..
Все о кейсах: Camel, Snake, Kebab & Pascal
В программировании вы сталкивались с ними при именовании переменной, класса или функции. Поддержание согласованности типов и стилей случаев делает ваш код более читабельным и облегчает совместную..