Доступный биомедицинский аннотированный набор данных - PullRequest
0 голосов
/ 05 июля 2019

Есть ли какие-либо биомедицинские наборы данных, которые были аннотированы?Я узнаю о том, как аннотируются биомедицинские тексты, в частности, для устранения неоднозначности.Но я открыт, чтобы увидеть аннотации для других целей.

1 Ответ

0 голосов
/ 05 июля 2019

Вот несколько корпусов для вас

| Entity           | Corpus                      | Type       | Size (sentences) |
|------------------|-----------------------------|------------|------------------|
| Gene and Protein | GENETAG [7]                 | Sentences  | 20000            |
|                  | JNLPBA [6] (from GENIA [8]) | Abstracts  | 22402            |
|                  | FSUPRGE [9]                 | Abstracts  | ≈29447*          |
|                  | PennBioIE [10]              | Abstracts  | ≈22877*          |
| Species          | OrganismTagger Corpus [11]  | Full texts | 9863             |
|                  | Linnaeus Corpus [12]        | Full texts | 19491            |
| Disorders        | SCAI Disease [13]           | Abstracts  | ≈3640*           |
|                  | EBI Disease [14]            | Sentences  | 600              |
|                  | Arizona Disease (AZDC) [15] | Sentences  | 2500             |
|                  | BioText [16]                | Abstracts  | 3655             |
| Chemical         | SCAI IUPAC [17]             | Sentences  | 20300            |
|                  | SCAI General [18]           | Sentences  | 914              |
| Anatomy          | AnEM1                       | Sentences  | 4700             |
| Miscellaneous    | CellFinder2                 | Full texts | 2100             |

источник

...