TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Remaining Length of Stay	HiRID	LGBM	MAE	56.9±0.4	# 1
Respiratory Failure	HiRID	LSTM	AUPRC	0.569±0.003	# 7
Kidney Function	HiRID	LGBM	MAE	0.45±0.00	# 1
Kidney Function	HiRID	TCN	MAE	0.50±0.01	# 5
Kidney Function	HiRID	LSTM	MAE	0.50±0.01	# 5
Kidney Function	HiRID	GRU	MAE	0.49±0.02	# 4
Kidney Function	HiRID	Transformer	MAE	0.48±0.02	# 3
Kidney Function	HiRID	LGBM ( + hand crafted features)	MAE	0.45±0.00	# 1
Circulatory Failure	HiRID	LR	AUPRC	0.305±0.000	# 6
Circulatory Failure	HiRID	LSTM	AUPRC	0.32.2±0.008	# 7
Circulatory Failure	HiRID	TCN	AUPRC	0.35.8±0.006	# 7
Circulatory Failure	HiRID	GRU	AUPRC	0.368±0.005	# 4
Circulatory Failure	HiRID	Transformer	AUPRC	0.352±0.006	# 5
Circulatory Failure	HiRID	LGBM	AUPRC	0.389±0.003	# 2
Circulatory Failure	HiRID	LGBM ( + hand crafted features)	AUPRC	0.388±0.002	# 3
Respiratory Failure	HiRID	Logistic Regression	AUPRC	0.530±0.000	# 8
Respiratory Failure	HiRID	GRU	AUPRC	0.592±0.003	# 4
Respiratory Failure	HiRID	TCN	AUPRC	0.589±0.003	# 5
Respiratory Failure	HiRID	Transformer	AUPRC	0.594±0.003	# 3
Respiratory Failure	HiRID	LGBM	AUPRC	0.585±0.001	# 6
Respiratory Failure	HiRID	LGBM ( + hand crafted features)	AUPRC	0.604±0.002	# 1
Patient Phenotyping	HiRID	Logistic Regression	Balanced Accuracy	39.1±0.0	# 7
Patient Phenotyping	HiRID	GRU	Balanced Accuracy	39.2±2.1	# 6
Patient Phenotyping	HiRID	LSTM	Balanced Accuracy	39.5±1.2	# 5
Patient Phenotyping	HiRID	LGBM	Balanced Accuracy	40.4±0.8	# 4
Patient Phenotyping	HiRID	TCN	Balanced Accuracy	41.6±2.3	# 3
Patient Phenotyping	HiRID	Transformer	Balanced Accuracy	42.7±1.4	# 2
Patient Phenotyping	HiRID	LGBM ( + hand crafted features)	Balanced Accuracy	45.8±2.0	# 1
ICU Mortality	HiRID	LGBM	AUPRC	0.546±0.008	# 7
ICU Mortality	HiRID	Logistic Regression	AUPRC	0.581±0.000	# 6
ICU Mortality	HiRID	LSTM	AUPRC	0.600±0.009	# 5
ICU Mortality	HiRID	TCN	AUPRC	0.602±0.011	# 4
ICU Mortality	HiRID	GRU	AUPRC	0.603 ±0.016	# 3
ICU Mortality	HiRID	Transformer	AUPRC	0.610±0.008	# 2
ICU Mortality	HiRID	LGBM ( + hand crafted features)	AUPRC	0.626±0.000	# 1
Remaining Length of Stay	HiRID	LSTM	MAE	60.7±1.6	# 6
Remaining Length of Stay	HiRID	GRU	MAE	60.6±0.9	# 5
Remaining Length of Stay	HiRID	TCN	MAE	59.8±2.8	# 4
Remaining Length of Stay	HiRID	Transformer	MAE	59.5±2.8	# 3
Remaining Length of Stay	HiRID	LGBM ( + hand crafted features)	MAE	57.0±0.3	# 2

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/hirid-icu-benchmark-a-comprehensive-machine/remaining-length-of-stay-on-hirid)](https://paperswithcode.com/sota/remaining-length-of-stay-on-hirid?p=hirid-icu-benchmark-a-comprehensive-machine)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/hirid-icu-benchmark-a-comprehensive-machine/kidney-function-on-hirid)](https://paperswithcode.com/sota/kidney-function-on-hirid?p=hirid-icu-benchmark-a-comprehensive-machine)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/hirid-icu-benchmark-a-comprehensive-machine/respiratory-failure-on-hirid)](https://paperswithcode.com/sota/respiratory-failure-on-hirid?p=hirid-icu-benchmark-a-comprehensive-machine)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/hirid-icu-benchmark-a-comprehensive-machine/patient-phenotyping-on-hirid)](https://paperswithcode.com/sota/patient-phenotyping-on-hirid?p=hirid-icu-benchmark-a-comprehensive-machine)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/hirid-icu-benchmark-a-comprehensive-machine/icu-mortality-on-hirid)](https://paperswithcode.com/sota/icu-mortality-on-hirid?p=hirid-icu-benchmark-a-comprehensive-machine)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/hirid-icu-benchmark-a-comprehensive-machine/circulatory-failure-on-hirid)](https://paperswithcode.com/sota/circulatory-failure-on-hirid?p=hirid-icu-benchmark-a-comprehensive-machine)`

HiRID-ICU-Benchmark -- A Comprehensive Machine Learning Benchmark on High-resolution ICU Data

NeurIPS Datasets and Benchmarks 2021 · Hugo Yèche, Rita Kuznetsova, Marc Zimmermann, Matthias Hüser, Xinrui Lyu, Martin Faltys, Gunnar Rätsch ·

The recent success of machine learning methods applied to time series collected from Intensive Care Units (ICU) exposes the lack of standardized machine learning benchmarks for developing and comparing such methods. While raw datasets, such as MIMIC-IV or eICU, can be freely accessed on Physionet, the choice of tasks and pre-processing is often chosen ad-hoc for each publication, limiting comparability across publications. In this work, we aim to improve this situation by providing a benchmark covering a large spectrum of ICU-related tasks. Using the HiRID dataset, we define multiple clinically relevant tasks in collaboration with clinicians. In addition, we provide a reproducible end-to-end pipeline to construct both data and labels. Finally, we provide an in-depth analysis of current state-of-the-art sequence modeling methods, highlighting some limitations of deep learning approaches for this type of data. With this benchmark, we hope to give the research community the possibility of a fair comparison of their work.

PDF Abstract NeurIPS Datasets 2021 PDF NeurIPS Datasets 2021 Abstract

Code

Add Remove Mark official

ratschlab/HIRID-ICU-Benchmark official

Tasks

Add Remove

BIG-bench Machine Learning

Circulatory Failure

ICU Mortality

Kidney Function

Patient Phenotyping

Remaining Length of Stay

Respiratory Failure

Time Series

Time Series Analysis

Datasets

HiRID

Results from the Paper

Edit

Ranked #1 on Remaining Length of Stay on HiRID

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Remaining Length of Stay	HiRID	LGBM	MAE	56.9±0.4	# 1	Compare
Respiratory Failure	HiRID	LSTM	AUPRC	0.569±0.003	# 7	Compare
Kidney Function	HiRID	LGBM	MAE	0.45±0.00	# 1	Compare
Kidney Function	HiRID	TCN	MAE	0.50±0.01	# 5	Compare
Kidney Function	HiRID	LSTM	MAE	0.50±0.01	# 5	Compare
Kidney Function	HiRID	GRU	MAE	0.49±0.02	# 4	Compare
Kidney Function	HiRID	Transformer	MAE	0.48±0.02	# 3	Compare
Kidney Function	HiRID	LGBM ( + hand crafted features)	MAE	0.45±0.00	# 1	Compare
Circulatory Failure	HiRID	LR	AUPRC	0.305±0.000	# 6	Compare
Circulatory Failure	HiRID	LSTM	AUPRC	0.32.2±0.008	# 7	Compare
Circulatory Failure	HiRID	TCN	AUPRC	0.35.8±0.006	# 7	Compare
Circulatory Failure	HiRID	GRU	AUPRC	0.368±0.005	# 4	Compare
Circulatory Failure	HiRID	Transformer	AUPRC	0.352±0.006	# 5	Compare
Circulatory Failure	HiRID	LGBM	AUPRC	0.389±0.003	# 2	Compare
Circulatory Failure	HiRID	LGBM ( + hand crafted features)	AUPRC	0.388±0.002	# 3	Compare
Respiratory Failure	HiRID	Logistic Regression	AUPRC	0.530±0.000	# 8	Compare
Respiratory Failure	HiRID	GRU	AUPRC	0.592±0.003	# 4	Compare
Respiratory Failure	HiRID	TCN	AUPRC	0.589±0.003	# 5	Compare
Respiratory Failure	HiRID	Transformer	AUPRC	0.594±0.003	# 3	Compare
Respiratory Failure	HiRID	LGBM	AUPRC	0.585±0.001	# 6	Compare
Respiratory Failure	HiRID	LGBM ( + hand crafted features)	AUPRC	0.604±0.002	# 1	Compare
Patient Phenotyping	HiRID	Logistic Regression	Balanced Accuracy	39.1±0.0	# 7	Compare
Patient Phenotyping	HiRID	GRU	Balanced Accuracy	39.2±2.1	# 6	Compare
Patient Phenotyping	HiRID	LSTM	Balanced Accuracy	39.5±1.2	# 5	Compare
Patient Phenotyping	HiRID	LGBM	Balanced Accuracy	40.4±0.8	# 4	Compare
Patient Phenotyping	HiRID	TCN	Balanced Accuracy	41.6±2.3	# 3	Compare
Patient Phenotyping	HiRID	Transformer	Balanced Accuracy	42.7±1.4	# 2	Compare
Patient Phenotyping	HiRID	LGBM ( + hand crafted features)	Balanced Accuracy	45.8±2.0	# 1	Compare
ICU Mortality	HiRID	LGBM	AUPRC	0.546±0.008	# 7	Compare
ICU Mortality	HiRID	Logistic Regression	AUPRC	0.581±0.000	# 6	Compare
ICU Mortality	HiRID	LSTM	AUPRC	0.600±0.009	# 5	Compare
ICU Mortality	HiRID	TCN	AUPRC	0.602±0.011	# 4	Compare
ICU Mortality	HiRID	GRU	AUPRC	0.603 ±0.016	# 3	Compare
ICU Mortality	HiRID	Transformer	AUPRC	0.610±0.008	# 2	Compare
ICU Mortality	HiRID	LGBM ( + hand crafted features)	AUPRC	0.626±0.000	# 1	Compare
Remaining Length of Stay	HiRID	LSTM	MAE	60.7±1.6	# 6	Compare
Remaining Length of Stay	HiRID	GRU	MAE	60.6±0.9	# 5	Compare
Remaining Length of Stay	HiRID	TCN	MAE	59.8±2.8	# 4	Compare
Remaining Length of Stay	HiRID	Transformer	MAE	59.5±2.8	# 3	Compare
Remaining Length of Stay	HiRID	LGBM ( + hand crafted features)	MAE	57.0±0.3	# 2	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

HiRID-ICU-Benchmark -- A Comprehensive Machine Learning Benchmark on High-resolution ICU Data

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove