cui count: 4264719
str2cui count: 16991956
MRCONSO count: 8101235
ORIGIN
../../embeddings/claims_codes_hs_300.txt
Cui count:1013
Origin: 0.1524390243902439
../../embeddings/GoogleNews-vectors-negative300.bin
Tokenize
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 13325.06it/s]
Calculate average word embedding
1012it [00:00, 13586.83it/s]
Cui count:846
Origin: 0.058823529411764705
../../models/2020_eng
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6768.15it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1277.90it/s]
Cui count:1012
Origin: 0.022900763358778626
../../models/2020_eng
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6711.85it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1298.26it/s]
Cui count:1012
Origin: 0.010687022900763359
BETA
../../models/2020_eng
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6796.40it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1291.59it/s]
Cui count:1012
may_treat: 0.0183206106870229
../../models/2020_eng
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6778.01it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1295.40it/s]
Cui count:1012
may_treat: 0.22442748091603054
ALL
../../embeddings/claims_codes_hs_300.txt
Cui count:1013
1216it [06:14, 3.25it/s]
Average: 0.3472199935815148
Max: 0.5396341463414634
../../embeddings/GoogleNews-vectors-negative300.bin
Tokenize
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 14792.48it/s]
Calculate average word embedding
1012it [00:00, 18229.45it/s]
Cui count:846
837it [03:33, 3.92it/s]
Average: 0.06890856701103378
Max: 0.1213235294117647
../../models/2020_eng
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6772.47it/s]
100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1272.17it/s]
Cui count:1012
1215it [06:20, 3.19it/s]
Average: 0.22862564005905825
Max: 0.36946564885496186