数据科学药剂[关闭]

问题描述 投票:2回答:2

我最近开始玩Elixir,一些模式让我想起了Python,它广泛用于数据科学项目。例如列表推导或匿名函数。

考虑到Elixir的高性能以及运行多个进程和处理异步任务的能力,我认为它非常适合数据科学项目。

我错过了一点吗?有人有经验吗?

python elixir data-science
2个回答
5
投票

我支持使用正确的工具来完成这项工作。数据科学通常有两个要求:

  • 图书馆(因为你不想在每个角落重新发明轮子)
  • 性能(特别是在处理大量数据时)

Python和R是正确的工具。它们提供了最多的高质量库,虽然它们自身很慢,但由于使用C和Fortran等快速语言编写和优化的库,它们表现良好。

有些像朱莉娅和斯卡拉这样的替代品。这些是更快的语言,并且拥有相当数量的库,但是您可能仍会遇到Python或R中可用的合适库但不是Julia或Scala的情况。

使用像Elixir这样的语言,你自己就是最重要的。数据科学特定库的数量是有限的,Elixir社区 - 虽然很好 - 主要集中在分布式计算和Web开发,所以不要指望那里有很多支持。

总之,你呢?从技术上讲,是的,在实验中没有任何伤害,但是你的生活会变得更加艰难。

还要记住,与流行的看法相反,Elixir在单线程性能方面不是一种快速语言。根据手头的任务,你会发现Ruby在某些情况下同样快或甚至更快。

不要误会我的意思,Elixir是一门优秀的语言,它在最擅长的方面令人惊叹,只是它不是我首先要用于数学计算的那种语言。


2
投票

数据科学是一个非常广泛的主题,涉及很多事情,我想加上我的2美分,你肯定可以在elixir做数据科学,但它可能没有像其他一些工具做的那样做得很好,但你可以得到相当远的我使用elixir进行数据清理和数据格式化。

有其他人正在使用elixir / erlang https://moz.com/devblog/moz-analytics-db-free/进行数据相关的事情,并且有一个disco允许你在erlang https://github.com/discoproject/disco中运行MapReduce作业

© www.soinside.com 2019 - 2024. All rights reserved.