data-cleaning 相关问题

数据清理是删除或修复错误以及规范计算机程序中使用的数据的过程。例如，可以移除异常值，可以插入丢失的样本，可以将无效值标记为不可用，并且可以合并同义值。一种数据清理方法是Wickham的“整洁数据”框架，http：//vita.had.co.nz/papers/tidy-data.pdf，这意味着每一行都是一个观察，每一列都是一个变量。

有一种方法可以使用python

因此，这是我提出的解决方案，尽管它不太有用：

python pandas dataframe data-cleaning

回答 1 投票 0

R函数替换有货变量中所有“ f”的实例？

[1] Male Female [3] female Female/woman [5] Female F [7] female Woman [9] Cis female, she her Female cisgender [11] Female heterosexual I identify as a trans woman! [13] Demiboy Transwoman [15] My sex is female and my gender identity is nonbinary male [17] m woman [19] Woman Nonbinary [21] my gender doesn't exist Male/AMAB

r data-cleaning survey

回答 0 投票 0

如何在保留代码片段和数学公式的同时清洁聊天机器人的数据集？我正在从事一个项目，我需要清洁将用于聊天机器人的数据集。数据集包括文本数据，代码片段和数学公式，我想确保在

RECTACT敏感数据，例如URL，电子邮件地址和个人信息。标准化日期并从数据集的非代码部分中删除所有不必要的特殊字符。通过保持特殊字符，凹痕和语法完整来保留代码片段和公式的完整性。我的挑战是：

python data-cleaning data-preprocessing

回答 0 投票 0

如何修改<list>数据框列？我在rstudio工作，试图清理我从JSON文件转换的Pokémon数据集，并且我的数据框架名为BP1：物种项目能力 ...

species item ability <chr> <list> <chr> 1 Aegislash <chr [2]> Stance Change 2 Aegislash <chr [1]> Stance Change 3 Aegislash <chr [1]> Stance Change 4 Aegislash <chr [1]> Stance Change 5 Aegislash <chr [1]> Stance Change

rstudio data-cleaning

回答 1 投票 0

从文件中读取大型多部分表格，然后将其零件梳成一个tibble

我有以下结构的巨大文件（> 25 MB）：项目：时间段 0 项目：原子数 14748 项目：框边界SS SS SS -1.3314357502021994E+02 1.1517122459132779E+02 -1.3499049172495 ...

r tidyr data-cleaning tibble read-csv

回答 1 投票 0

使用dplyr

r dplyr data-cleaning

回答 1 投票 0

如何修复/重置减少时间戳，同时保留用于CNN培训的时间序列数据的差距？我目前正在尝试从一项从蜜蜂收集视频数据的研究中进行预处理数据。我遇到了一些问题，即记录的问题...

可以在这个小样本中显示这一点

python numpy time-series data-cleaning

回答 1 投票 0

使用 R 中的 str_split() 将 1 列拆分为 2 列

我有这个数据框 # 我的数据框 df <- data.frame( id_do_cliente = c(852, 966, 677, 877, 176, 69, 688, 525, 307, 127), nome_completo = c( "John Smith", "Emily Johnson&

r data-cleaning stringr

回答 1 投票 0

从列中删除中间名和首字母并保存在 R 中的单独列中

我有一列名字；有些有中间名或中间名缩写。我想从全名列中删除这些中间缩写，并在此列旁边创建一个新列来存储这些中间

r string data-cleaning

回答 2 投票 0

从列中删除中间名和首字母缩写并保存在单独的列中

我有一列名字；有些有中间名或中间名缩写。我想从全名列中删除这些中间缩写，并在此列旁边创建一个新列来存储这些中间

r string data-cleaning

回答 2 投票 0

从列中删除中间名和首字母缩写并保存在单独的列 R 中

我有一列名字，其中一些有中间名或中间名缩写。我想从全名列中删除那些中间首字母，并在此列旁边创建一个新列来存储这些中间...