Rudolf Ereman,Tbilisi,格鲁吉亚的数据科学开发商
Rudolf Eremanan.

佐治亚州第比利斯的数据科学开发商

成员自2018年7月3日起
Rudolf是一个具有五年的自然语言处理和机器学习经验的数据科学家。他'S开发了Georgian语言的第一个聊天框架,由格鲁吉亚最大的银行采用,并为来自美国和欧洲的公司创建了基于AI的工具。他的最后一个项目是财富500强公司使用的营销活动优化工具。
鲁道夫现在 可用的 for hire

文件夹

  • Ath Digital LLC.
    Docker.,Plotly,PostgreSQL,AWS S3,AWS Lambda,Jupyter Notebook,Pandas ...
  • Zelos.ai.
    AWS. EMR.,Pyspark,Jupyter,亚马逊Web服务(AWS),统计数据......
  • Windsor.ai.
    jupyter.,DB,营销,Google Analytics,PostgreSQL,SQL,统计,R ...

经验

地点

第比利斯,格鲁吉亚

可用性

兼职

优选的环境

亚马逊Web服务(AWS),Scikit-Searn,Git,Linux,AWS,Python

最神奇的......

......框架I.'ve开发是格鲁吉亚语言的聊天框架。

就业

  • 数据科学家

    2020 - 至今
    Ath Digital LLC.
    • 开发了一种用于在数据库中加载,处理和存储Facebook广告和Google AdWords数据的管道。
    • 开发工具,用于将CSV报告从S3自动上传到数据库应用AWS服务。
    • 创建预测和可视化模型"balance burn rate."
    技术:Docker,Plotly,PostgreSQL,AWS S3,AWS Lambda,Jupyter Notebook,Pandas,AdWords API,Facebook API,Cron,Python
  • 高级数据科学家

    2019年 - 2020年
    Zelos.ai.
    • 开发了一种使用SCRAPY,SELENIUM,LXML和其他Python库解析动态和静态网页的数据擦刮工具。
    • 使用AWS服务如批处理,ECR,S3和DynamoDB创建批处理数据处理管道。
    • 应用机器学习技术,用于创建用于从原始文本和不正确的网页提取数据提取的工具。
    • 使用Docker和Docker组合用于集装箱整个项目。
    • 基于蒙特卡罗方法开发了竞技竞争模拟。
    • 设计了数据库的平台和数据模型的架构。
    • 分析>100M运动性能数据与Pyspark在AWS EMR上运行。
    技术:AWS EMR,Pyspark,Jupyter,亚马逊网络服务(AWS),统计数据,数据科学,AWS DynamoDB,AWS Lambda,AWS EC2,AWS S3,LXML,数据建模,数据库建模,代码体系结构,马尔可夫模型,马尔可夫链蒙特Carlo(MCMC)算法,批量,简单,DB,数据刮擦,硒,数据工程,机器学习,自然语言处理(NLP),ETL,Docker,AWS,Python
  • 数据科学家

    2018 - 2019年
    Windsor.ai.
    • 开发用于不同数据库管理系统之间的数据迁移的脚本。
    • 使用Python和R库扩展现有数据预处理流程。
    • 改进归因建模管道集成新功能并修复错误。
    • 广泛使用的SQL用于分析数据,查找异常和有价值的见解。
    • 从不同在线广告平台拉动的数据开发和修改的脚本。
    技术:Jupyter,DB,营销,Google Analytics,PostgreSQL,SQL,统计,R,Pandas,Python
  • 数据科学家

    2018 - 2019年
    边境数据公司
    • 推特流中趋势检测的模型。
    • 开发了基于AI的应用程序's architecture.
    • 集成内部ML模型,带有云服务作为IBM Bluemix和Google Cloud NLP。
    • 使用Google BueQuery的大数据集合作。
    • 为新的ML型号评估创建了自定义模块。
    • 文本分类的培训机器学习模型。
    • 为现有应用程序创建了测试。
    技术:Jupyter,DB,时间序列分析,R,自然语言处理(NLP),大数据,Python
  • 数据科学家

    2016 - 2018.
    pulsar ai.
    • 为格鲁吉亚语言开发了聊天框架。
    • 创建了一个自动新闻文章分组工具。
    • 为来自社交网络的文本进行情感分类设计了一种工具。
    • 使用时间序列进行分析和预测加密货价。
    • 分析 data and presented results in a clear manner.
    技术:Jupyter,DB,MongoDB,Git,Docker,Numpy,熊猫,Spacy,FastText,Keras,NLTK,Gensim,Scikit-Learn,Python
  • 软件开发人员实习

    2016 - 2016年
    Virtuace Inc.
    • 修复了错误。
    • 扩展现有应用程序的功能。
    • 测试的新模块。
    技术:XML,Apache Tomcat,Java,Git,Linux
  • 完整堆栈软件工程师

    2014 - 2016年
    格鲁吉亚技术大学
    • 开发了管理和使用语言学生的前端。
    • 创建了使用语言语料库数据操作的Web服务。
    • 组织数据库结构,用于存储和操纵语言信息。
    • 使用NLP工具分析文档并以明确的方式呈现结果。
    Technologies:DB,Python,NLTK,语言学,MySQL,REST,JavaScript,CSS,HTML

经验

  • Twitter流中的趋势检测(开发)

    使用具有时间序列分析的组合的自然语言处理算法在Twitter流中开发了较早趋势检测的模型。
    开发用于使用Twitter API拔出和分析Twitter流的脚本。

    用不同地块进行分析的可视化结果,以便更好地解释。

  • 营销优化归因建模(开发)

    归因建模是用于衡量货币影响的方法,这是一段通信对真正的业务目标,例如销售,客户保留,收入和利润。

    在处理此项目期间,我已广泛使用SQL进行数据操作和分析,以及Python和R库。我开发了数据迁移和客户端通知脚本。此外,实现了用于检查完整性和现有数据的正确性的数据完整性测试。与分布在世界各地的国际团队合作。

  • 高级新闻过滤器(开发)

    使用Google BigQuery分析了新闻大数据集。

    文本过滤机制中的文本分类的培训机器学习模型。集成的云ML服务,如IBM Bluemix和Google Cloud NLP,具有现有应用程序。

  • 格鲁吉亚语言的聊天框架(开发)
    //www.facebook.com/TBCTIbot/

    TI-BOT,第一个聊天BOT说格鲁吉亚。

  • 自动新闻文章分组工具(开发)

    新闻文章分组工具使用Word Vectoriving Technization,其中包含集群算法的组合,用于自动分组从新闻网站解析的类似文章。

  • 社交媒体情绪分析工具(开发)

    社交媒体情感分析工具是自然语言处理技术和机器学习算法的组合,用于预测来自社交网络(如Facebook和Instagram)收集的评论和帖子的情绪。

  • 格鲁吉亚语言(开发)拼写检查

    拼写检查器工具使用具有强大的机器学习和自然语言处理方法的经典算法,用于检测和纠正句子中的错误。这个产品由格鲁吉亚最大的公司使用,用于检测和纠正文件中的错误。

  • 加密货币价格监测工具(开发)

    Cryptocurrency Pricts监控工具使用时间序列分析算法和高速发音机API与Sentmence分析等NLP工具相结合,用于监测和预测比特币和其他加密货币的价格变动。

  • 用于自动识别格鲁吉亚方言的NLP工具(其他令人惊叹的事情)

    一种用于自动识别来自不同来源的格鲁吉亚方言的工具,例如论坛,社交网络等。它是基于机器学习分类方法和NLP方法。在开发期间,我合作了一群准备培训和评估分类模型数据的语言学家。

    该项目被授予“对第比利斯州立大学第76名学生会的最佳科学研究”

  • 语言语料库管理系统(开发)

    开发了一种用于存储,操纵和分析语言数据的Web应用程序。

  • 制药行业数据的ETL管道(开发)

    通过收集,清洁和管理来自不同来源的数据,与客户组建新数据库的客户团队合作。使用AWS服务实现ETL,存储日志等。

  • 仿真Tokio 2020奥运会(开发)

    解析并分析了大量的运动员的绩效数据。应用蒙特卡罗统计方法对模拟轨道和现场比赛的运动员绩效数据。使用AWS Cloud Services来运行计算和存储生成的结果。

  • 四个情感分析准确度的缺陷(出版物)
    手动收集有关用户生成的数据的信息是耗时的,可以说是耗时。那'为什么更多组织正在转向自动情绪分析方法 - 但基本模型唐'总是削减它。在本文中,Toptal自由职业者数据科学家Rudolf Ereanan概述了一些情绪分析GotChas,可以做些什么来解决它们。

技能

  • 语言

    Python, SQL., , XML., javascript., java., HTML., CSS., R, 抨击
  • 图书馆/ API.

    熊猫, 克里克特 - 学习, nltk., 美丽的汤, 休息API., XGBoost., scipy, numpy., 隐星, Twitter API., Pyspark., 谷歌广告关键词, 凯拉斯, matplotlib., 谷歌云API., AdWords API., Facebook API., 谷歌分析 API.
  • 工具

    格雷洛, jupyter., Git.Hub., Gensim, PGAdmin, Bitbucket., Git., Apache Tomcat., cr, 情节, 谷歌分析
  • 范式

    数据科学, Etl., 克鲁姆, 休息
  • 平台

    亚马逊网络服务(AWS), 苹果系统, Docker., Linux., AWS. lambda., jupyter笔记本, AWS. EC2.
  • 贮存

    AWS. S3, D B, PostgreSQL., MongoDB., mysql., 数据库建模, AWS. DynamoDB., IBM Bluemix.
  • 其他

    数据刮擦, 机器学习, 网刮, 文本分类, 文字矿业, 数据分析, 数据分析, 数据分析师, 批量文件处理, AWS., 预测分析, 数据工程学, Apache超级集, 常用表达, 聚类算法, 主题建模, 网页服务, 数据挖掘, 归因建模, 自然语言处理(NLP), 马尔可夫链蒙特卡罗(MCMC)算法, 马尔可夫模型, 代码架构, 数据建模, Lxml., FastText., 语言学, 大数据, 时间序列分析, s, 计算语言学, 统计数据, 数据结构, 算法, IBM云
  • 构架

    , 烧瓶, Scrapy., AWS. EMR.
  • 行业专业知识

    营销, 贸易, 卫生保健

教育

  • 掌握'计算机科学学位
    2017年 - 2019年
    第比利斯州伊万岛爪哇省爪哇省 - 第比利斯,格鲁吉亚
  • 学士'计算机科学学位
    2013 - 2017年
    第比利斯州伊万岛爪哇省爪哇省 - 第比利斯,格鲁吉亚

认证

  • AWS.认证解决方案架构师2020年
    5月2020年5月 - 至今
    CloudGuru.
  • 与r的营销分析
    2019年8月 - 至今
    datacamp.com.
  • 谷歌分析个人资格
    2018年12月 - 2019年12月
    广告数字学院
  • 深度学习暑期学校
    2017年7月 - 至今
    德福托大学
  • 深度学习纳迪格
    2017年1月 - 至今
    udacity.
  • 机器学习在线课程
    2016年2月 - 至今
    斯坦福大学
  • 语言与现代技术
    2016年2月 - 至今
    歌德大学法兰克福/主要

查看更多个人资料

加入Toptal.
与他人分享