Thomas Debray,荷兰乌得勒支的开发者
Thomas is available for hire
Hire Thomas

Thomas Debray

Verified Expert  in Engineering

Data Scientist and Developer

Location
Utrecht, Netherlands
Toptal Member Since
March 18, 2022

Thomas在风险建模和因果推理方面拥有17年的经验,并作为一名科学家管理了超过100万欧元的研究基金. Since 2019, 他曾担任多家全球制药公司和cro的独立承包商. 他的目标是通过采用最先进的分析方法和及时提供科学审查来改善数据驱动的决策.

Portfolio

Smart Data Analysis and Statistics
Bayesian Inference & 建模,生物统计学,元分析,PHP, MySQL, HTML...
Undisclosed Pharmaceutical Company
R, RStudio, Microsoft PowerPoint,因果推理,临床试验...
BioMed Central Ltd
出版,生物统计学,机器学习,文献综述...

Experience

Availability

Part-time

Preferred Environment

R, PHP,统计学,机器学习,风险模型,因果推理

The most amazing...

...我开发的工具是统计方法, software, 以及主要科学期刊和国际社会认可的指导方针.

Work Experience

Senior Statistician

2022 - PRESENT
Smart Data Analysis and Statistics
  • 在IV期试验的设计和分析过程中提供统计支持, post-authorization safety studies, historical control studies, and pooled studies (e.g., meta-analysis).
  • Built a Shiny app to facilitate blinded sample size re-estimation (BSSR) in bio-equivalence studies with multiple primary endpoints and >2 treatment arms.
  • 为精准医疗开发了一个R包. 该软件包托管在CRAN上,并实现了双重鲁棒的精确医学方法来匹配, cross-validate, 并将条件平均治疗效果的预测模型可视化.
  • 使用R和Python开发,评估和实现风险预测模型.
  • 使用GCP和Amazon AWS建立高级模拟研究.
  • 管理几位数据科学家和统计学家,开发生物统计学和机器学习的培训材料.
  • 使用PHP和MySQL开发和维护公司的主要网站,并实现各种api,如Bootstrap, Carousel, Google Charts, and Calendly.
  • 编辑了一本手册,指导使用真实世界数据进行比较有效性研究和个性化医疗.
Technologies: Bayesian Inference & 建模,生物统计学,元分析,PHP, MySQL, HTML, JavaScript, Machine Learning, CSS, Bioinformatics, Python, Jupyter Notebook, Monday.com, Risk Models, Data Science, Amazon Web Services (AWS), SQL, Linux Mint, Linux, Database Design, Graphical User Interface (GUI), Statistical Data Analysis, Predictive Modeling, Data Analytics, Database Analytics, Google Ads

Contract Senior Biostatistician

2021 - PRESENT
Undisclosed Pharmaceutical Company
  • 制定了一项研究方案,为一项非介入性队列研究创建一个合成对照臂.
  • 回顾统计分析计划,对随机试验和真实世界证据进行系统文献综述和网络荟萃分析.
  • 严格审查现有的数据来源,并评估其在生成合成控制臂方面的效用.
Technologies: R, RStudio, Microsoft PowerPoint,因果推理,临床试验, Epidemiology, Biostatistics, Statistical Analysis, Health Economics & Outcomes Research (HEOR), Literature Review, Database Design, Statistical Data Analysis, Data Analytics

Associate Editor

2016 - PRESENT
BioMed Central Ltd
  • 管理开放获取期刊BMC诊断与预后研究的文章提交和编辑同行评议.
  • 向稿件作者提供所需修改的反馈.
  • 邀请领域专家对提交的手稿进行批判性审查.
Technologies: 出版,生物统计学,机器学习,文献综述, Causal Inference, Risk Models

Contract Senior Data Scientist

2021 - 2022
Proalto
  • 协助实现信用风险建模的机器学习方法.
  • 规划开发自动化小额贷款软件平台.
  • 对软件平台的开发报价进行了严格的审核.
技术:R,机器学习,金融科技

Assistant Professor

2013 - 2022
University Medical Center Utrecht
  • 制定了进行风险预测和因果推理的统计方法和准则. Key topics: regression, meta-analysis, multiple imputations, multilevel modeling, Bayesian inference, propensity score analysis, machine learning.
  • Created master-of-science courses, workshops, online training modules, 以及为国际学生和教职员工提供教育和信息的wiki.
  • 构建一个开源的R软件包,并通过可调用范围累积记录(CRAN)维护更新和bug修复。.
  • 使用Amazon AWS和GCP建立高级模拟研究,以评估和比较分析方法的性能.
  • 使用惩罚回归开发并验证了预测模型, multilevel regression, random forests, XGBoost, neural networks, and support vector machines.
  • 担任欧洲委员会和世界卫生组织资助的各种国际项目的首席研究员. 申请国家和国际研究经费.
  • 管理一支国际硕士生、博士团队.D. 候选人和博士后,并监督他们的日常活动.
  • 在流行病学研究中提供重要的评论和分析支持.
  • 与国际组织建立新的合作关系, including universities, healthcare agencies, and pharmaceutical companies.
  • 发表了大约100篇同行评审的科学手稿.
技术:流行病学,生物统计学,机器学习,元分析,培训 & 培训内容开发,R, RStudio,贝叶斯推理 & Modeling, Clinical Trials, Causal Inference, GitHub, Subversion (SVN), Wikis, Data Visualization, Data Analysis, JAGS, WinBUGS, Eclipse IDE, Data Science, SQL, Amazon Web Services (AWS), Google Cloud Platform (GCP), Linux Mint, Linux, Database Design, Graphical User Interface (GUI), Research, XGBoost, Regression, Statistical Data Analysis, Predictive Modeling, Data Analytics, Education

Scientific Consultant

2021 - 2021
未披露健康技术评估(HTA)机构
  • 回顾了评估一种新疗法的成本效益的卫生经济模型的有效性.
  • 评估一个离散事件模拟模型的Java源代码,以识别计算和编码错误.
  • 验证了技术报告与离散事件仿真模型参数及输出的一致性.
  • 为提高离散事件仿真模型的透明度和可用性提供科学建议.
  • 参与电话会议,讨论技术报告, disease and clinical area, 以及健康经济模式的适宜性.
  • 审阅客户的咨询报告草稿,并通过邮件解决客户的疑问.
Technologies: Java, Biostatistics, Markov Model, 马尔科夫链蒙特卡罗(MCMC)算法, Monte Carlo Simulations, Health Economics & 结果研究(HEOR),统计数据分析,数据分析

Contract Senior Biostatistician

2020 - 2021
Undisclosed Nonprofit Association
  • 对研究方案进行系统的文献回顾,并对所需的分析步骤提供反馈.
  • 对通过文献综述获得的已发表证据进行多层次荟萃分析.
  • 协助起草最后报告, preparing a scientific publication, 并处理与方法和统计调查有关的审稿人意见.
  • 开发R代码,从已发布的报告中恢复丢失的信息,并进行元分析.
Technologies: Literature Review, Meta-analysis, R, RStudio, Biostatistics, Database Design, Statistical Data Analysis, Data Analytics

Contract Senior Biostatistician

2019 - 2021
Undisclosed Pharmaceutical Company
  • Developed, evaluated, 并采用统计方法对现实世界证据研究进行系统回顾和荟萃分析, conducting causal inference, and imputing missing data.
  • 作为咨询小组的领域专家参加,并讨论使用来自多个来源的数据开发和验证风险预测模型的现有方法.
  • 为统计分析计划提供重要的意见, study designs, statistical approaches, results in interpretation, 并协助起草报告和手稿.
  • 在谷歌云平台(GCP)上使用R和JAGS进行广泛的模拟研究,评估高级数据分析方法的性能.
  • 对用于综合随机对照试验和观测数据的现有统计方法进行了批判性概述,并评估了其优缺点.
  • 开发预测个体化治疗效果估计的统计框架,并进行模拟研究以评估其准确性.
  • 管理多个独立顾问协调研发活动.
  • 为各种高级统计方法开发R代码,并通过GIT维护更新.
技术:R, RStudio,生物统计学,统计学,元分析,贝叶斯推理 & Modeling, Causal Inference, Epidemiology, Clinical Trials, GitHub, Risk Models, 马尔科夫链蒙特卡罗(MCMC)算法, Literature Review, Google Cloud Platform (GCP), Database Design, Statistical Data Analysis, Predictive Modeling, Data Analytics

Contract Senior Data Scientist

2020 - 2020
Infodation B.V.
  • 审核R Shiny应用程序,以促进项目规划和管理.
  • 使用GIT版本管理识别和修复软件错误.
  • 起草了一份技术报告,其中包括改进R Shiny应用程序及其长期可持续性的关键建议.
  • 管理来自一个维护R Shiny软件的独立顾问的反馈和输入.
Technologies: R, RStudio Shiny, MySQL, JavaScript, Git, Data Science, Database Design, Graphical User Interface (GUI), Data Analytics, Database Analytics

Software Developer Consultant

2007 - 2010
Source NV-SA
  • 维护源NV-SA的前端和后端, 该公司于2010年被Tech Data Corporation收购.
  • 开发并实施公司主站内容管理系统(CMS)的新模块.
  • 开发了一个基于web的Java工具,以支持客户确定适当的备份和分级解决方案.
技术:Java, c#, SQL, HTML, JavaScript, ASP.. NET、数据库设计、图形用户界面

Metamisc:一个在风险预测中进行元分析的R包

http://CRAN.R-project.org/package=metamisc
开源和开放访问的R包Metamisc促进了诊断和预后研究的频率和贝叶斯元分析.

我是主要的开发人员,并合并了一些功能来进行多元元分析,以总结预测模型性能的估计(doi:10).1177/0962280218785504)并评估发表偏倚的存在(doi:10).1002/jrsm.1266).

R包最初是为了促进硕士学位和博士学位的教育而开发的.D. 现在主要由学生和研究者着手进行系统的文献综述.

在2022年,R包已经作为JASP软件的正式扩展模块实现.

提高风险模型的通用性

作为一名科学家,我获得了超过100万欧元的资金来领导和开展这项创新的方法研究. 这使我能够开发、评估和实施新的风险预测统计方法. 这些方法已发表在主要科学期刊上, 并允许提高风险模型在多种环境和人群中的普遍性.

Key references:
• http://doi.org/10.1002/sim.5732
• http://doi.org/10.1136/bmj.i6460
• http://doi.org/10.1177%2F0962280216660741
• http://doi.org/10.1016/j.jclinepi.2014.06.018
• http://doi.org/10.1002/sim.5412
2010 - 2013

流行病学硕士学位

乌得勒支大学-乌得勒支,荷兰

2009 - 2013

流行病学和生物统计学博士

乌得勒支大学-乌得勒支,荷兰

2007 - 2009

人工智能理学硕士学位

马斯特里赫特大学-马斯特里赫特,荷兰

2004 - 2007

计算机科学硕士学位

Hogeschool Gent - Gent, Belgium

Libraries/APIs

XGBoost

Tools

LaTeX, GitHub, Eclipse IDE, Microsoft PowerPoint, Git, Subversion (SVN)

Languages

R, PHP, Java, HTML, JavaScript, SQL, Python, COBOL, c#, CSS

Platforms

RStudio, Windows, Ubuntu, Linux Mint, Linux, MacOS, Jupyter Notebook, Fedora, Google Cloud Platform (GCP), Amazon Web Services (AWS)

Paradigms

Data Science, Database Design

Frameworks

RStudio Shiny, ASP.NET

Storage

MySQL

Industry Expertise

Bioinformatics

Other

JAGS, WinBUGS, Training & 培训内容开发,统计学,机器学习,贝叶斯推理 & Modeling, Biostatistics, Regression, Epidemiology, Causal Inference, Meta-analysis, Risk Models, Monte Carlo Simulations, Health Economics & Outcomes Research (HEOR), Literature Review, Statistical Data Analysis, Predictive Modeling, Data Analytics, Scientific Data Analysis, Monday.com, Wikis, Clinical Trials, Graphical User Interface (GUI), Database Analytics, Data Mining, Image Processing, Information Retrieval, Signal Processing, Statistical Methods, Statistical Analysis, Markov Model, 马尔科夫链蒙特卡罗(MCMC)算法, Publishing, Data Visualization, Data Analysis, Programming, Big Data, Research, Predictive Analytics, Education, Google Ads, Fintech

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

Start your risk-free talent trial

与你选择的人才一起工作,试用最多两周. Pay only if you decide to hire them.

Top talent is in high demand.

Start hiring