我真的有一座法师塔 第173章 疯狂的柚子科技(第二更)

3061年12月30日,加州时间21:50,湾区圣克拉拉山景城的一座看起来并不起眼的红色三层建筑中依旧灯火通明。

一名看起来有些清瘦,身穿蓝色格子衬衫的三十多岁男子正在聚精会神的看着左侧的电脑屏,手中不停地敲出的代码显示在右侧的电脑屏中。

这附近肉眼可见的所有的建筑几乎都是古狗公司的。

而这座看起来并不起眼的建筑,正是四年多前古狗刚刚创立的新部门——古狗大脑。

在几个月前,古狗刚刚收购了15岁考上牛津、17岁就独立开发出大热游戏《模拟公园》的超级天才德米斯哈萨比斯的deepmind,这给古狗大脑团队带来了一些压力。

尤其这一两个月,deepmind那边的大卫似乎在蒙特卡洛树算法上取得了非常大的突破。

古狗给了他们很多资源,这更是让作为古狗亲儿子的古狗大脑倍感压力。、

不过也还好,deepmind和古狗大脑进行的是两个不同层面的研究。deepmind偏向应用,而古狗大脑偏向于基础性研究,双方的合作大于竞争。

“杰夫、杰夫!那个柚子科技的Fang,Yu和约尔兹教授在arXiv上又发了一篇论文,《基于自注意力机制下的序列中长距离的依赖关系》。太惊人了,这已经是这个月第三篇重磅论文了!”

一名又瘦又小的亚裔男子端着pad跑到穿着蓝色格子衬衫杰夫迪恩的工位上,操着略带口音的盎语略带激动的把pad递了过去。

“天啊,我根本查不到这个约尔兹教授是谁,而那个方豫,我所能找到的资料显示,他居然还是大周国立大学金融学的在校大学生,居然不是学计算机和数学的,这实在太疯狂了!”

“这篇《基于自注意力》论文你一定要看一下,这和卢卡斯团队正在搞的方向几乎是重合的。但很明显,柚子科技已经走在了我们前面。”

“你先停一下,看看这篇文章,这篇论文至少能节省我们6个月的时间。你在……我的天,这是什么?”

瘦小的亚裔男子瞥了一眼杰夫迪恩的电脑屏幕,一下子就呆住了。

杰夫迪恩脸上带着点苦笑:“黎,可能他们不只是领先了卢卡斯团队的‘加法’研究。”

“这是一个训练框架?”瘦小的亚裔男子不客气的把手放在杰夫迪恩的鼠标上,开始上下滚动。

“是的,他们称之为柚子0.1,我刚刚已经测试了一下,这个框架比我们的TensorFlow0.5效率至少提高了30倍。”

“0.1版本的框架,居然还有库?而且已经发布了12个工具?”姓黎的亚裔男子瞠目结舌。

“你问过吴吗?他怎么说?”杰夫迪恩捏了捏自己的鼻梁,他一直心态都非常平和,很少沮丧也很少发脾气,但今天,他首次出现了深深地挫败感。

黎姓男子从电脑屏幕上移开视线,摇了摇头:“问过了,吴从未听说过这家公司,他现在也在找人问这家公司的具体情况,这家公司的注册地址是在大周的国立大学。据他说,国立的计算机科学在大周并不算非常强的学科。”

他们口中的吴,正是在四年多前,与杰夫迪恩一起创建了古狗大脑的前斯坦福人工智能实验室主任吴恩德。

瘦小的黎姓亚裔男子,是古狗大脑的另一创始人黎越国,吴恩德是他的博士生导师。

连同黎越国在内,古狗大脑的核心技术团队中,接近一半都是吴恩德的学生。

可以说,没有吴恩德,就没有今天的古狗大脑。

而吴恩德,也在去年来到大周,加入了千寻,成为千寻的首席科学家,全面负责千寻的AI研究,短短一年多的时间,就让千寻在很多AI关键领域的开发与研究超越了古狗。

事实上,大周的人工智能发展在3061年之前甚至有很多地方是超过迈国的。

在提及“深度学习”和“深度神经网络”的期刊论文数量上,大周在3059年就已经超过了迈国,而且论文质量也并不差。

这也是吴恩德选择去千寻,一方面是千寻的诚意很足,robert亲自邀请;另一方面,也是因为大周本身在这方面展现出的人才潜力。

“这个训练架构比千寻的paddle也要强很多很多,吴应该也会很感兴趣吧。”杰夫迪恩脸上泛起一抹笑容。

“看来我们的对手除了千寻之外,可能又会增加一个了。”黎越国深以为然的点点头,突然想到些什么,扭头看着杰夫迪恩,“要不要现在就把这家公司收购掉?你可以问一下赛琳娜。”

杰夫迪恩无可奈何的摊了摊手:“我们决定不了收购哪家公司,不过我几个小时前尝试给这家公司发了一个询价邮件,问他们是否愿意接受古狗的收购。”

黎越国来了精神:“有回复吗?”

杰夫迪恩点开gmail:“你自己看。”

黎越国把头凑过来,杰夫迪恩在下面写了几千字的技术讨论和收购邀约,可对方给的回复就是一个单词。

No。

连落款都没有。

“算了,吴会比我们更头疼,对了,NMT的训练我们可以用这个柚子架构测试一下……”

——

吴恩德确实有些不算严重的头痛,但并不是因为柚子科技,而是因为内部问题。

他去年加入千寻后,的确有过一段时间的蜜月期,和上面的交流也非常愉快,更做出了不少突破性的工作。

但时间长了,他发现自己有些东西还是想简单了。

谁能想到这公司老板真的不一定说了算?

不过,好在团队非常争气,继paddle的优化后,现在又搞出了deepbench,估计最多一两年,千寻的整个AI业态就能够成熟起来了。

deepbench是一套针对硬件平台的深度学习性能进行评估的平台,通俗来说,就是用来评测硬件的深度学习性能的鲁大师。

而且,去年又刚刚娶了漂亮老婆,正是感情最好的时候。

因此,吴恩德的心情还是蛮不错的。

直到他在github上看到了柚子科技发布的柚子框架0.1。

这套框架使用了Apache 2.0许可证,这意味着它是开放源代码的,但不完全是自由软件。

让他暗暗心惊的是,这个框架的性能异常强劲,不止比千寻的paddle强大,比古狗的TensorFlow0.5更是强的不是一星半点。

如果说性能的强劲说不定是这个小公司瞎猫碰上死耗子的话,那柚子科技在自己不断完善平台生态这件事则让他彻底坐不住了。

短短一周之中,柚子科技已经上传了大大小小12个示例代码、模型和库,每一个都非常实用,并且和柚子框架的结合非常紧密。

而且,除了柚子科技,现在居然有其他开发者在上传示例代码和丰富库了。

这个框架刚刚发布一天时间吧?

吴恩德眉头紧皱,抬手就给老板发信息:robert,我希望收购一家公司,柚子科技,这是这家公司的资料。

虽然千寻有很多问题,但吴恩德对robert还是信赖的。

他加入千寻第二天,就要求千寻购买一千个GPU,结果24小时内,这些GPU就已经出现在他的实验室了。

但如果在古狗,他提交审批后,可能需要几周甚至几个月的时间,才能在云端申请到相应的算力资源。

“叮。”手机上的信息闪了一下。

“好的,我和梅丽莎商量一下。”