Taste 是非常棒的一个推荐系统核心引擎,sf 上可以下载到 Taste 的最新版本。Taste 同时也是 2007 Google Summer of Code 里的一个项目。 当初学习推荐系统开发的时候,遍搜网络,这个是我个人找到的最全面最完整的一个开源包。细读代码之后,虽然没有 Lucene 曾经带给我的那种震撼,但也绝对可以称得上是开源世界里的上佳之作!经常有朋友发 Email 希望我介绍一些推荐系统相关的资料,这个是我必然推荐给大家的一个。 下面翻译自 Taste 文档的 Overview 部分。
2007年6月30日,Taste 发布了其最新的一个版本 1.5.5。在这个版本里面,甚至还包含了针对 Netflix 数据的一个实验包。不得不说,Netflix Prize [1] [2], 真的是一个双赢的活动!本来,推荐领域已经冷清了有些日子,其中一个很大的原因就是大家做实验的基础只有 GroupLens/EachMovie 这两个数据源,搞来搞去想突破也不容易了。Netflix 公开他的数据,使做 Research 的学者们拿到了宝贵的 big data,终于可以跳出 GroupLens/EachMovie 的框框了。随着基于 Netflix 数据所取得的最新研究成果不 断出现,无疑会不断促进着推荐技术下一个热潮的到来。与此同时,学者们的积极参与,也使得 Netflix 越来越接近于其追求的推荐准确率,并且,通过媒体的广泛报道,Netflix 也赢得了高知名度和好的口碑。说实在的,用 1M$ 买到如此多最新的技术成果,同时又获得了不小的商业收益,这个买卖真是值了! 去年,我试着给 Taste 的作者发过几次 Email,希望能加入到 Taste 的开发 Team 里,可一直没有收到任何答复。今年年初,在 Google Summer of Code 上又申请了一次,仍然没有回应。始终入不了高人的法眼,说明自己差距还很大啊。要说开源的推荐引擎,Java 下最多,PHP 有个 Vogoo,Python 下零零散散的也能找到一些,唯独 .Net 下基本没有。基于上两方面的原因,我和一个好朋友商量,准备把 Taste 移植到 .Net 平台下。一来通过移植代码,加深自己的理解;二来也算是为 .Net 社区做点儿贡献,哈哈。 我们的项目暂时命名为 Beyond.Thoth,之所以没有叫 Taste.Net,主要是因为我们打算逐步加入自己的一些实现。改名这事儿对 Taste 可能有些不敬,但我们会在代码里面,明显标出对 Taste 的引用。目前核心代码已经移植完毕,正在进行算法的准确性验证和性能调优。资源在这里,目前还是空的,有发布后我会第一时间在 blog 里通知各位朋友。 |
Taste/Thoth:开源的推荐系统引擎
最新推荐文章于 2025-01-10 09:15:34 发布