艾伦周,机器学习开发商在新加坡,新加坡
艾伦周

机器学习开发商在新加坡,新加坡

成员自2017年6月13日以来
Alan是一家Ex-Google高级软件工程师,其中博士学位,来自麻省理工学院和国际奥林匹克在信息学中的银牌奖牌。他快速了解新技能,并迅速提供结果。 Alan在Google的大规模机器学习和数据处理项目上工作,数据库开发工作量在DGraph中。他还熟悉节点和React.js。
艾伦现在 可用的 for hire

文件夹

  • HFT公司
    系统,内核旁路,架构
  • graph
    RocksdB,筏达共识算法,GRPC,Goland
  • 谷歌(山景)
    flume,mapreduce,scikit-searn,c ++,机器学习

经验

地点

新加坡,新加坡

可用性

兼职

优选的环境

Subversion(SVN),Git,Cloud9,Sublime文本,Linux

最神奇的......

......我曾研究过的项目涉及开发机器学习管道,每天处理数百十亿数据点。

就业

  • 软件工程师

    2016年 - 至今
    HFT公司
    • 领导整个团队在新加坡办事处。
    • 与亚洲市场负责公司,这是公司的主要来源's revenue.
    技术:系统,内核旁路,架构
  • 软件工程师

    2016 - 2017年
    graph
    • 减少数据库数据加载时间为60%。以前,我们在试图变异时迭代哈希图。因此,我们不得不使用无锁的哈希图,这些哈希图实际上比普通哈希图慢。我重组了代码,以便不再存在这种争用。当我们现在可以使用普通哈希映射时,代码变得更加简单,更快。
    • 实现了许多关键功能,如索引,过滤,排序和分页。
    • 实施了新的开发实践,即在不影响效率的情况下增加可用性。随着新功能的增加,很明显,不变的Flobuffers太痛苦了。我意识到该团队在过去没有使用和基准测试协议缓冲区,并在正确使用时显示了一些分析,表明协议缓冲区,而不是FLINBUFFERS慢。我们转换,每个人都很高兴我们不'T必须再处理FlinBuffers了。
    • 驾驶獾项目,一个Go LSM树钥匙值商店。实现了Memtables,Compaction和框架将所有内容连接在一起。该项目将其送到Hackernews的十大名单。
    技术:RocksdB,筏互补算法,GRPC,Goland
  • 高级软件工程师

    2013 - 2016年
    谷歌(山景)
    • 致力于使用大规模机器学习的团队进行排名和价格搜索广告,这是谷歌'主要收入来源。目标是通过显示更多相关广告来增加广告商和用户的满意度。数据驱动的分析和实验是了解我们变化影响的关键。
    • LED一个项目借助查询群集执行脱机功能计算。这导致了令人印象深刻的26%的AUC损失(机器学习公制)的改善,根据人类评估者将ADS质量提高8%。
    • 重写MapReduce管道,用于存档广告登陆页数据。新版本实现了大于10倍的加速,并导致每年收入增长1.5亿美元。
    • 减少了在我们的团队中移动的数据量'S训练管道,在过程中实现了2倍的加速。
    技术:Flume,Mapreduce,Scikit-Searn,C ++,机器学习

经验

  • 谷歌的查询页面相关性(开发)

    我们的团队有关广告的登陆页面对用户查询有益的问题。

    延迟很重要。我们不能为我们的机器学习系统花费太多时间计算功能。

    围绕此方法的一种方式是重新编译特征值。可能性的数量太多了,因此我们尝试使用各种技术,例如聚类来减少它。该项目涉及写Mapreduce管道以预增强这些功能。它还涉及许多A / B测试和数据分析。

  • DGRAGE(开发)
    //github.com/dgraph-io/dgraph

    dgraph是一个图表数据库。它基本上是存储关系的反相索引。我实现了关键功能,如过滤,排序和分页。通过用常规哈希贴图替换无锁哈希映射并简化代码,我将数据加载时间减少60%。我还帮助实现了缓存层,基本上是存储在RockSDB中的发布列表的差异。

    我对Badger LSM键值存储的工作可能是最快的基于Go的键值存储。 DGraph项目能够使用獾而不是RocksDB来避免CGO问题。

  • 矩阵铅笔稀疏傅立叶变换(开发)

    这是我的博士项目之一。我最近有一些新想法(2017年),并希望很快包装这个。

    FFT操作需要O(n log n)时间。但是,如果我们知道信号在频率空间中稀疏,(即只有几种模式),那么我们希望能够在O(s)时间内执行此FFT,忽略日志因子,其中“s”是稀疏性或者我们要恢复的模式数量。

技能

  • 语言

    , C ++, Python, PHP., 红宝石
  • 范式

    Mapreduce., 数据库设计
  • 贮存

    RocksdB.
  • 其他

    数值编程, 统计数据, 机器学习, Cloud9, 筏共识算法, 建筑学, 内核旁路, 系统, GPU计算, 深度学习, 加强学习
  • 构架

    grpc., 红宝石 on Rails(ROR)
  • 图书馆/ API.

    克里克特 - 学习, 反应, node.js.
  • 工具

    崇高文本, Git., Subversion(SVN), 水管, g
  • 平台

    Linux.

教育

  • 博士在应用数学中
    2008 - 2013年
    马萨诸塞州理工学院 - 马萨诸塞州剑桥
  • 学士'数学学位
    2004年 - 2007年
    UC Berkeley - 加利福尼亚州
  • 学士'计算机科学学位
    2004年 - 2007年
    UC Berkeley - 加利福尼亚州

查看更多个人资料

加入Toptal.
与他人分享