large-data 相关问题

大数据是难以处理和管理的数据,因为其大小通常超出用于执行分析的软件的限制。

大字节数组--在字节数组内存储长度有什么好处吗?

问:将大数组的长度存储在数组本身有什么好处吗?解释一下。比方说,我们通过使用GZipStream类的GZipStream来压缩一些大型二进制序列化对象... ...

回答 2 投票 1

如何基于生成器创建一个数组?

说我有一个大数组。A = 2*np.ones([100, 100, 100]) 我想对它进行一些计算,例如: def squared_elements(M): yield M**2 我选择使用生成函数,因为我的... ...

回答 1 投票 0

如何在C#中处理大量数据与MySQL查询?

我在MySQL中有大量的数据,正好是10180行,而且每天都在更新,还有200-300行。而在我的C#应用程序中,我有一个背景工作程序,它获取数据并加载......。

回答 1 投票 -1

Python多处理。如何正确设置max_workers的数量?

背景:我有一个巨大的DataFrame,里面有很多线程。我有一个巨大的DataFrame,有4000万行。我必须在一些列上运行一些函数。循环的时间太长了,所以我决定使用多处理。CPU。8核16...

回答 1 投票 0

如何有效地查找包含列表项的数据框行?

假设我有以下示例项目= ['牛奶','面包','水'] df:名称为item1 item2 item3 items_1牛奶水项目_2牛奶橡胶汁项目_3果汁纸木...

回答 1 投票 0

将大文件传输到webworker / websocket

使用chrome / edge时,我在尝试将20mb +文件传输到worker / websocket时遇到问题,小于20mb的文件可以正常工作。如果我注释掉ww.postmessage行和...

回答 1 投票 -1

显示大数据表

免责声明:我的职业生涯是从事嵌入式软件,最近我才涉足桌面应用程序。我正在开发的应用程序具有一个模拟,该模拟生成一个稀疏的二维矩阵,它的...

回答 1 投票 0

不知道长度时如何在SQL Server中存储varbinary(max)和varchar(max)数据(使用C ++ ODBC)

如何使用C ++ ODBC API存储varbinary(max)和varchar(max)列。有什么建议吗?我正在使用SQL Server本机客户端。我正在使用列方式绑定来绑定参数数组。 ...

回答 1 投票 1

处理(存储在json中的大数据集的最有效方法是什么?

我有一个json,其中包含以360k行代码编写的28k对象。我有一个程序,它可以解码json,然后使用解码后的数据(Google地图中的28k标记)。解析json的函数是...

回答 1 投票 0

加快大型LP(> 1000万个决策变量)求解时间的方法

我有一个大型LP,具有超过一千万个决策变量和几乎相同数量的约束。我使用CPLEX来解决LP,但要花大约20个小时才能解决,这是在...

回答 1 投票 1

如何基于生成器创建数组?

说我有一个大数组:A = 2 * np.ones([100,100,100])我想对其进行一些计算,例如:def squared_elements(M):yield M ** 2我选择使用生成器函数,因为我的...

回答 1 投票 0

大数据集对训练模型大小的影响?

[如果数据集很大,是否意味着模型大小也会很大?

回答 1 投票 0

内存错误,具有1GB矩阵,64位Python和RAM负载

[[注意:虽然已经有一些关于在numpy中处理大型矩阵的文章,但是它们并不能解决我的特定问题。]我正在尝试加载存储在.... txt文件的...中的30820x12801矩阵...

回答 1 投票 0

Python通过等待直到内存可用来处理内存错误

我正在尝试在具有多个用户的系统上加载和处理非常大的文件。是否可以通过使脚本重试在...

回答 1 投票 0

我的计划建议-大量的学生和年级数据集,希望对最低2%的学生进行分类

我有一个数据集,其中包含全国学生及其成绩的社会经 济指标。更具体地说,该数据集包含36个变量,其中约有3000万学生作为预测变量...

回答 1 投票 2

为什么使用setTimeout的函数不会导致堆栈溢出

我正在编写用于处理大量数据的测试。令我惊讶的是,如果我在函数中添加了setTimeout,它将不再导致堆栈溢出(对于该站点是多么合适)。这是怎么回事...

回答 2 投票 0

使用vaex绘制大数据

我一直在努力创建具有数百万行的csv图。我试图使用vaex模块,但卡住了.. import vaex#将大的csv转换并读取为hdf5格式df = vaex.open(“ ...

回答 1 投票 1

基于多个列的值的具有重复键的两个大型DataFrame的有条件合并/连接-Python

我来自R,老实说,这是使用R data.tables在一行中做的最简单的事情,对于大型数据表,该操作也非常快。 Bu我真的很努力地在...

回答 1 投票 0

更新MySQL表中的大量行

我正在使用关系数据库(MySQL 5.7)。在此数据库上,我有一个名为customer_transaction的表。在此表上,我有4列:id,customer_id,类型,金额| id | customer_id |类型|金额| ...

回答 1 投票 0

插入具有数百万行的性能

我正在尝试使用Python脚本来解析Wikipedia档案。 (是的,我知道。)当然:Wikipedia XML:45.95 GB可用内存:16 GB这排除了将文件加载到内存中,然后进行...

回答 1 投票 4

© www.soinside.com 2019 - 2024. All rights reserved.