比Spark快100倍的GPU加速SQL引擎!BlazingSQL开源了
|
越小越好 运行以下 Colab 演示,用户可以使用免费英伟达 T4 GPU 资源进行同样的测试,对 BlazingSQL 的实际效果进行验证: https://colab.research.google.com/drive/1EbPE9FwFur7fE2054BH9s23Kd0FiUgGo 据 介绍,BlazingSQL 大部分性能提升来自团队的内部引擎项目,BlazingSQL 团队的工程师们希望开发一种专为 GPU DataFrames(GDF)构建的 GPU 执行内核,称之为“SIMD 表达式解释器”(SIMD Expression Interpreter)。研发团队分享了一些关于 SIMD 表达式解释器的细节,SIMD 表达式解释器通过几个关键步骤带来提升性能:
目前,SIMD 表达式解释器支持 BlazingSQL 的过滤和投影,因此它对许多主流的 SQL 查询都有影响。 使用 BlazingSQL 在 Amazon S3 中查询 CSV 文件的示例代码:
更多 BlazingSQL 的操作方法参见: GitHub 项目链接:https://github.com/blazingdb/pyBlazing/ 官方网站:https://docs.blazingdb.com/docs/using-blazingsql 【编辑推荐】
点赞 0 (编辑:信阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- 如何在Linux Shell编程中定义和使用函数
- Linux文件操作之文件查询与搜索命令详解
- boot-loader – 使用Windows从USB闪存驱动器中删除MBR
- 开始使用Go For It吧,一个灵活的待办事项列表程序
- remote-desktop – 如何禁用Administrator的RDP访问权限
- 重命名Windows中目录中所有文件的简便方法
- windows-server-2008 – 远程桌面100%通过浏览器?
- 如何在Windows 10 中恢复已删除的游戏
- 这波操作不错——你真的会高效的在GitHub搜索开源项目吗?
- windows-7 – 在Windows 7中将程序作为域管理员帐户运行并以
