Carlos Guerreiro,自然语言处理(NLP)开发商在埃斯波,芬兰
Carlos Guerreiro

自然语言处理(NLP)开发商在埃斯波,芬兰

成员自2013年3月9日起
Carlos是一种特殊的数据通用,在所有项目中为数据密集型系统的设计,实施和验证提供了大量的经验,以及机器学习和实时流处理的深刻专业知识。
卡洛斯现在 可用的 for hire

文件夹

  • 感知结构
    redis,c ++,node.js,javascript,r,python,机器学习
  • Markavip.
    甲骨文,MySQL,Spark,Redshift,AWS Kinesis,C ++,Java,R,Python
  • Codento.
    Ruby在Rails(ROR),Java,CoffeeScript,Node.js,JavaScript,Python

经验

地点

芬兰埃斯波

可用性

兼职

优选的环境

ipython,命令行界面(cli),emacs,git,linux,macoS

最神奇的......

......我'VE构建是一个活动流相关滤波器 - 一个低延迟,通过从1/2 TB的未标记数据培训的深度神经网络监督学习循环。

就业

  • 创始人

    2010年 - 至今
    感知结构
    • 使用Node.js和Redis构建自定义活动流数据处理管道。
    • 使用Python和Node.js构建针对Free Text的Feature提取的深度神经网络架构的无监督培训管道。
    • 使用Node.js和C ++建立低延迟活动流相关过滤器。
    • 在C ++中构建优化的随机森林和天真贝叶斯分类器,具有与Node.js和Python的绑定。
    • 使用Node.js,socket.io和自定义数据/ DOM绑定框架构建了用于活动流相关过滤的实时Web UI。
    • 使用Node.js,redis,socket.io和jQuery构建了用于培训分类器的低延迟框架。
    • 为Android构建了一个混合本机/ HTML自定义活动流客户端,与过滤集成。
    • 为电子商务建立了一个实时自定义推荐系统。混合协作过滤+内容(文本和元数据)。 Python,C ++。分布式和多核。
    • 为电子商务建立了一个定制的交易风险分析系统。 Python + R.
    • 为电子商务建立了自定义营销信息时序优化器。 Python + R.
    技术:Redis,C ++,Node.js,JavaScript,R,Python,机器学习
  • 数据科学总监

    2015年 - 2016年
    Markavip.
    • 在AWS,围绕Kinesis,Redshift和Spark的公司建造和部署了公司的基础分析骨干。该设计余额可扩展性,对分析师的可访问性,低管理员开销的关键目标,以及对批量和流分析的支持。
    • 每当实用的,通过低延迟接口(如数据库复制)的低延迟接口,从关键系统集成到分析骨干的综合数据。
    • 将一些交互跟踪系统迁移以直接沉入骨干。
    • 将关键分析系统迁移到骨干,包括推荐人。
    • 疯狂的各种改进推荐人,包括使用细粒度记录的印象作为负信号,以及处理目录元数据的更灵活性。
    • 对客户体验的干预措施进行分析和实时操作,以减少回报和取消的影响。优化是通过对历史数据的回顾性仿真进行策略搜索。作为HTTP微服务(Python,Kinesis,Redshift)操作。
    • 扩大上述系统,通过优化篮子限制和激励来提高订单盈利能力。
    • 进行了回顾性的采购性能和定价分析。我们的系统不't保持对所有相关数据的完整历史记录,因此通过从数据库复制日志持续捕获的行突变并存储在Redshift(Python / C ++)中来完成此分析。
    技术:Oracle,MySQL,Spark,Redshift,AWS Kinesis,C ++,Java,R,Python
  • 软件/数据架构师

    2011年 - 2015年
    Codento.
    • 在AWS上使用Node.js和MongoDB构建媒体启动的图像上传/预处理管道。包括在后端的Rails应用程序上使用Ruby登录。
    • 使用Node.js(与Python Back-End集成)和Batman.js集成,实现了在定制的结构化消息传递应用上实现了实时路径更新。
    • 使用D3.js构建的自定义,交互式数据显示定制结构化消息传递应用程序。
    • 在CoffeeScript中实现了用于使用Batman.js的结构化消息传递应用程序的复杂数据输入UI。
    • 构建了自定义C#分布式数据分析管道,以在AWS上执行MATLAB作业。
    • 促成C的嵌入式安全设备。
    • 用Django贡献到Python中的结构化消息传递应用程序的后端。
    • 为经济数据设计和实现自定义交互式数据分析和可视化。 Python后端+ d3.js可视化。
    • 为医疗保健启动建立了自定义护士计划和路由优化系统。 Python和D3.JS求解的Gurobi预处理和混合整数模型配方。
    • 现有的实时运输物流系统的系统设计实现可扩展性和更高的性能。企业java。
    • 为银行客户设计和实现了用于高安全性网络架构的参考应用程序。 Scala / Play,Slick,双因素身份验证。
    • 促成了大规模的在线存储系统实现。 Python + PostgreSQL。
    • 构建了一个自定义MATLAB系统,可在黑盒优化期间从数据调整遗留应用程序(衍生物免费)。
    技术:Ruby在Rails(ROR),Java,CoffeeScript,Node.js,JavaScript,Python
  • 首席软件架构师

    2009年 - 2010年
    诺基亚|齿轮
    • 原型设计了一种基于语音和手势的基于语音的用户界面,用于在oz向导到软件概念验证(Python,Java,Sphinx)的各种级别的车载手机使用。
    • 为一家汽车产品架构定义了软件架构,输入到硬件平台选择。
    • 计划的成本,日程表和执行多个新产品开发方案。
    • 有计划和适度的原型验证和迭代的可用性研究。
    • 进行严格的可行性研究和齿轮的软件架构。
    技术:Sphinx搜索引擎,Java,Python
  • 团队领导,高级r&D Manager

    2003年 - 2009年
    诺基亚| Maemo.
    • 从头开始招募和升起Maemo Application Framework团队。
    • 定义了应用程序框架架构和开发策略。
    • 导致三个主要软件世代的实施以及更新。
    • 影响诺基亚'进入开源开发。
    • 为Linux开发开发了相当大的分包和合作网络。
    • 促使初始产品概念定义。
    技术:Maemo.
  • 高级软件工程师

    2001年 - 2003年
    诺基亚|研究中心
    • 原型为C ++中的小型Linux设备的小型覆盖关系数据库。
    • 基于Python中的语义Web技术的手持设备的个人信息管理器进行原型。
    • 研究和评估了旨在基于Linux的手持设备的应用程序框架的架构选择,由Nascent Maemo项目采用。
    Technologies:Python,C,C ++
  • GIS / Computer Graphics Freelancer

    1998年 - 2001年
    cgeo.net.
    • 使用C ++,Windows和Oracle Technologies建立了一个GIS编辑葡萄牙农业部的土地凯特。
    • 建立了自定义C ++框架,以提供拓扑集成的地理向量数据的实时操纵。
    • 在Windows中使用C ++,为专门咨询,在Windows中为专门咨询,为专门咨询的半自动执行(优化)进行了地理决策支持系统。
    • 开发,许可,最后出售了一种用于室内设计软件的射线跟踪渲染模块,用C ++编写。
    • 建立GIS编辑葡萄牙农业部的橄榄树凯德斯特,以窗口中的C ++建造的空中摄影集成橄榄树识别。
    技术:Oracle,Python,C ++

经验

  • Rawhash(开发)
    //github.com/pconstr/rawhash

    使用哈希作为关键的实验性,二进制,友好的替代方法:值缓存,节点.js.

    键是二进制缓冲对象而不是字符串。值是任意对象。

    Rawhash是基于Google-sparsehash和Murmurhash3(包括的)。

  • RDB-Parser(开发)
    //github.com/pconstr/rdb-parser

    用于Redis RDB数据库转储的异步流解析器,以100%JavaScript编写,用于在Node.js中使用。

  • 增量随机森林(开发)
    //github.com/pconstr/irf

    Leo Breiman随机森林变体的C ++(带有Node.js和Python绑定)的实现

    由于添加或删除样本而不是每次从头开始完全重建森林,而不是完全重建 - 以节省资源。

    它不是流化实现,因为存储所有样本,并且在需要递归地重建无效子树时将重新看出。更新每个树木的努力可以大幅度变化,但更新森林的整体努力在树上平均平均,并且往往不会显着变化。

  • Catsagram(开发)

    滚动Instagram照片的猫,建立在实验与自定义数据/ DOM绑定(Data-Graft.js),响应布局(尝试调整窗口大小)和套接字。

  • Data-Graft.js(开发)
    //github.com/pconstr/data-graft.js

    动画友好,差异的DOM模板引擎,独立的和框架无关。建立与动态数据/ DOM绑定进行实验,特别关注有关动画数据更改转换的灵活性。

技能

  • 语言

    Python, C ++, C, , javascript., SQL., R, CoffeeScript., java., Scala.
  • 图书馆/ API.

    node.js., 火花流, e, 克里克特 - 学习, scipy, Twitter API., numpy., D3.js, jquery., matplotlib., 熊猫, Theano., Facebook API.
  • 范式

    数据科学, 分布式计算, 并行计算, 分布式编程, 功能规划
  • 平台

    Linux., AWS Kinesis., 亚马逊网络服务(AWS), 谷歌应用引擎, Maemo., 甲骨文, 苹果系统, 安卓
  • 贮存

    redis., 红移, 莱德布, MongoDB., Sphinx搜索引擎, mysql., RocksdB., 卡桑德拉
  • 构架

    阿帕奇火花, django, Hadoop., 瓶子, Ruby on Rails(ROR), 火花
  • 工具

    马铃薯, Git., emacs., iPython.
  • 其他

    机器学习, 科学计算, 命令行界面(CLI), 自然语言处理(NLP), 龙卷风

教育

  • 掌握'计算机科学学位
    1991年 - 1996年
    Universidade Nova de Lisboa - 里斯本,葡萄牙

查看更多个人资料

加入Toptal.
与他人分享