我正在为数据科学项目开设 BI 课程,并希望给我的学生一些关于数据仓库/数据湖的实践练习,因为作为数据科学家/分析师,他们经常会从数据仓库/数据湖中提取数据。我教他们数据库,并让他们使用 SQLite 动手操作 SQL。
我在争论是否让学生在数据仓库/数据湖上进行动手实践更有用,或者这只会给他们带来更多的困惑,因为这门课程向他们抛出了很多技术。数据专家有什么想法吗?
如果让他们亲身体验数据仓库/湖是个好主意,应该考虑什么免费的开源数据仓库/湖。我倾向于 Vertica,但希望确保是否有其他选择从学生的职业角度来看更相关。
PS:我对付费/免费试用解决方案不感兴趣,因为它确实由于金钱限制在尝试和实验的自由方面限制了学生。
如果这不是正确的地方或提出这个问题的正确方式,请告诉我。
----我试过的东西---- 我尝试搜索开源数据仓库,但我得到的大多数结果都是数据仓库工具/ETL 工具。我找过数据仓库,我找到的唯一已知的是 Vertica。 我还查看了 stackoverflow,但我发现的帖子是 5 多年前的,因为这个领域发生了重大变化