Nilan Saha,加拿大温哥华开发人员
Nilan is available for hire
Hire Nilan

Nilan Saha

Verified Expert  in Engineering

NLP和机器学习开发人员

Location
Vancouver, BC, Canada
Toptal Member Since
February 17, 2022

Nilan是一名自然语言处理和机器学习专家,拥有计算机科学学士学位和数据科学硕士学位,专攻计算语言学. Nilan在构建大型推荐系统方面有着丰富的经验, personalization technology, and NLP algorithms. 作为一名Kaggle专家,他在这一领域的出版物被广泛引用.

Portfolio

AAQUA
Scikit-learn, Python, Go, Elasticsearch, Amazon DynamoDB, Neo4j...
Packt Publishing
技术写作、GPT、自然语言处理(NLP)...
Knowt
Python, SpaCy, PyTorch,深度学习

Experience

Availability

Part-time

Preferred Environment

MacOS, Slack, Zoom, Visual Studio Code (VS Code), Jupyter Notebook

The most amazing...

...thing I've ever built is Convex, 一个词性标注的自然语言处理库,使用字符和词级嵌入神经网络.

Work Experience

Machine Learning Engineer

2020 - PRESENT
AAQUA
  • 构建和部署多个个性化ML管道,为应用程序的主要用户提要提供动力. 这些管道使用Python、Kafka、AWS S3、scikit-learn和NLTK构建,并部署到AWS上.
  • 使用Python和Elasticsearch设计、构建端到端搜索解决方案. 驱动数据驱动决策和更好的搜索结果相关性排名的分析管道是使用Kafka构建的, Amazon Pinpoint, and AWS S3.
  • 使用Python和Elasticsearch设计、构建端到端自动完成解决方案. 驱动数据驱动决策和搜索结果相关性排名的分析管道是使用Kafka构建的, Amazon Pinpoint, and AWS S3.
Technologies: Scikit-learn, Python, Go, Elasticsearch, Amazon DynamoDB, Neo4j, GPT, 自然语言处理(NLP), 生成预训练变压器(GPT)

Technical Reviewer

2020 - 2020
Packt Publishing
  • 与团队合作测试所有代码示例,并确保用户可以轻松地从书中复制项目. 代码由PyTorch中构建的神经网络和NLTK中的各种其他预处理实用程序组成.
  • 与编辑团队一起审阅书中的所有章节并进行必要的修改, technical and otherwise.
  • 对书的内容提出了各种改进建议.
Technologies: Technical Writing, 生成预训练变压器(GPT), GPT, 自然语言处理(NLP), PyTorch

Machine Learning Engineer

2020 - 2020
Knowt
  • 使用ELMo嵌入开发了一个具有多个头部的深度神经网络,以识别可用于生成测验和完成其他下游任务的短语. 该模型使用Python、PyTorch和Flair构建,并部署到AWS.
  • 使用spaCy和Python开发了一个从文本数据中提取三元组的管道, build relations using them, 并以知识图的形式表示出来.
  • 领导建立一个基于隐式用户反馈的数据集来训练模型.
技术:Python, SpaCy, PyTorch,深度学习

Data Scientist

2018 - 2018
Cookt
  • 开发了一种使用命名实体识别(NER)的启发式算法, spaCy, 以及自然语言工具包(NLTK),从食谱说明数据中识别烹饪材料.
  • 创建了一种算法,使用已识别的成分生成最佳烹饪说明,以减少最终用户的摩擦.
  • 将模型捆绑到API中,并与内部技术团队合作将其集成到整个堆栈中.
技术:自然语言工具包(NLTK), SpaCy, Python,亚马逊网络服务(AWS)

Convex

http://github.com/nilansaha/convex
Convex是一个轻量级的NLP库,它使用PyTorch编码的深度学习模型支持POS标记. 它使用自定义字符级和单词级嵌入来为神经网络提供动力,并提供卓越的性能.

有毒评论的多标签分类器

我使用拥抱脸转换器库中的BERT构建了这个多标签分类模型, PyTorch, 二叉交叉熵损失分类对有毒评论进行分类,并获得f1分90分.5%.

Categorical Embedding Encoder

http://github.com/nilansaha/CategoricalEmbeddingEncoder
我使用Python和Keras开发了一个框架. 它可以用来训练和表示使用向量嵌入表格数据集的分类变量, 哪些改进了经典的机器学习模型.

Languages

Python, Go, GraphQL

Libraries/APIs

SpaCy, PyTorch, Scikit-learn, Natural Language Toolkit (NLTK), Keras

Other

自然语言处理(NLP), Machine Learning, GPT, 生成预训练变压器(GPT), Software, Software Development, Computer Science, Deep Learning, Data Structures, Technical Writing, Computational Linguistics

Frameworks

Flask

Paradigms

Data Science

Platforms

Software Design Patterns, Apache Kafka, MacOS, Visual Studio Code (VS Code), Jupyter Notebook, Amazon Web Services (AWS)

Tools

Slack, Zoom

Storage

数据库,Elasticsearch, Amazon DynamoDB, Neo4j

2019 - 2020

数据科学与计算语言学硕士学位

英属哥伦比亚大学-加拿大温哥华

2015 - 2019

计算机科学学士学位

工程与管理学院-加尔各答,印度

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

Top talent is in high demand.

Start hiring