本文共 590 字,大约阅读时间需要 1 分钟。
本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.10节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。
当你用R完成了一个机器学习项目时,接踵而来的问题就是能否将解决方案部署到生产环境中去。答案通常是否定的。因为性能和内存限制,开源的R语言对生产系统来说通常不是一个好的选择。对于需要连接到特别大数据集的海量数据机器学习项目来说,性能和内存特别重要,所以除了使用其他语言,例如C++或者Python之外,还有其他选择吗?你可以从使用bigmemory包开始,它能帮助你创建、存储、连接和操纵大量矩阵。然后你可以通过添加biganalytics、bigalgebra、bigtabulate和bigpca包来获得更高级的功能。这些包可以在建立一个可行的生产系统之路上帮助你走得更远,但你依然可能在路上遭遇绊脚石。好在,有几个商业版本的R环境适合企业级应用。其中一个是Revolutions Analytics公司提供的Revolution R Enterprise(RRE)。另一个是TIBCO公司的TIBCO Enterprise Runtime for R(TERR)。这两个商业版本都能提供适合R机器学习算法的最佳版本,用以快速处理海量数据。
转载地址:http://xwogx.baihongyu.com/