data-processing 相关问题

数据处理涉及将原始数据转换为机器可读形式以及随后由计算机处理(如存储,更新,重新排列或打印出来)。

MySQL:使用单个查询在整个表中将'NULL'替换为实际NULL值的字符串

[当我尝试查询:SELECT * FROM my_table,其中my_column为Null时,它返回0个结果。该列是整数。但是当我这样做时:SELECT * FROM my_table where my_column ='Null'它将返回...

回答 1 投票 0

机器学习模型的数据预处理

我对如何预处理基于范围的类别(例如年龄,肿瘤大小和inv节点)感到困惑。我应该取平均值的平均值,例如-14.5、24.5等,还是对...

回答 1 投票 -1

通过Sensor ID在MATLAB中拆分表

我在MATLAB中有一个大表,其中包含超过1000行的数据,分为两列。第1列是收集数据的传感器的ID,第2列是数据本身(在这种情况下,...

回答 2 投票 0

如何用R中的条件更新列名的值?

我有如下数据框。注意:这是我的数据的样本数据。数据:id user time1 time2 time3 1 user1 07:52 08:34 08:43 2 user2 08:14 10:09 10:22 3 user3 07:43 ...

回答 1 投票 -1

如何将存储为文本的数字分为awk或sed或其他形式?

我需要分割我的文本文件。在我的文本文件中,我有数字。这是我输入文件的一小部分。在我的文本文件中,我的编号从29026到58050。29026 29027 29028 29029 29030 29031 ...

回答 1 投票 -1

哪种语言可以将数百万个脏地址稳定地处理为标准格式?

我目前正在使用NodeJS来创建一个程序,该程序将使用未清除的,类型错误的脏地址,并将其转换为包含所有找到或填充的所有组件的标准格式,以供在...中进一步使用...] >>

回答 1 投票 0

Python:有没有办法显示最小化函数的使用参数?

我对编程还很陌生,现在有点沮丧。我无法在任何地方找到问题的答案,并尝试了几项尝试,但都没有成功。我有一个尺寸和一个...

回答 1 投票 0

将嵌套列表转换为具有列名称的pandas数据框

原始DataFrame的图像,我有一个嵌套列表,看起来像这样。功能= [['0:0.084556','1:0.138594','2:0.094304 \ n'],['0:0.101468','4:0.138594','5:0.377215 \ n'],['0 :0 ....

回答 2 投票 0

文件异步到达的相关数据处理管道

我有几个与数据相关的任务/管道,其中一些任务/管道取决于另一个任务的完成。更难的是数据可以异步到达,这意味着某些任务需要...

回答 1 投票 0

如何将数据框设置值转换为多个布尔列?

列术语存储一个带有几个字符串的集合(固定的〜1000个字符串集中)。 df = pd.DataFrame([[{'city','mouse'}],[{'mouse'}],[{'blue'}]],...

回答 1 投票 1

要嵌套到新列中的嵌套列表-Pandas,Python

data = {'user':['Steeve','Pam','Olive'],'mentions':['Pam',['Steeve','Olive','Marc'],['Paul' ,'Lou']],'reply_to':[{'id':'123','username':'alpha'},[{'id':'231','username':'...

回答 1 投票 0

如何根据图像名称将图像数据集划分为子集?

我有一个名为“ Fingers”的数据集,我正在尝试在该数据集上构建TensorFlow模型。但是,我有点卡住了,因为我想根据图像的最后两个字符对图像进行划分' ...

回答 1 投票 0

格式化数据框

我之前只在这里发布过一次,所以请原谅我关闭格式化功能。我还要说这是一个学校项目。无论如何,我只是在学习熊猫,数据处理和csv,并且正在创建...

回答 2 投票 0

仅在值范围内运算

我有一个数据框,需要在其中基于其他样本来估算一个值。该列为数字,表示行业编号fx(1111-IT,1234-Finance,依此类推)。我试图申请...

回答 1 投票 0

如何在C ++中有效地排序成千上万的数据输入?

假设我有10000+个跨越一个月的大纪元时间戳,需要对其进行排序。在程序中,我必须对这些Epoch Timestamps进行排序(由13位长long int组成,例如1359997200000 ...

回答 1 投票 0

如何在C ++中有效地分组成千上万的数据输入?

假设我有多个csv文件,每个文件包含近10000多行数据。但是我只需要在每一行中将一个特定的单元格(F列中的时期时间戳)输入到程序中,就可以了。...

回答 1 投票 0

如何使用python对Millon数据行进行ETL?

我有一个pgAdmin数据库,其中包含数百万个geojson格式的行。使用此表,我创建了Tableau仪表板。由于行包含geojson格式的数据,因此我必须像这样查询:select ...

回答 1 投票 0

如何使用定长列表进行预处理?

我想使用以下数据训练我的回归模型,并使用sklearn并用它来预测其他参数给定的收益:但是,当我尝试拟合模型时遇到了一些问题。来自...

回答 1 投票 0

对[0,1]范围内的数据帧中的数据进行归一化

我正在尝试使用PIMA Indians Diabetes数据集的论文。这是在输入缺失值之后的数据集:葡萄糖BP皮肤厚度胰岛素BMI谱系...

回答 1 投票 0

麻烦训练张量流神经网络,如何解决此问题?

我目前正在使用三类车辆(货车/ SUV,小汽车和卡车)训练图像分类模型。我有1800张训练图像和210张验证图像。当我尝试插入...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.