cui count: 4264719 str2cui count: 16991956 MRCONSO count: 8101235 ORIGIN ../../embeddings/claims_codes_hs_300.txt Cui count:1013 Origin: 0.1524390243902439 ../../embeddings/GoogleNews-vectors-negative300.bin Tokenize 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 13325.06it/s] Calculate average word embedding 1012it [00:00, 13586.83it/s] Cui count:846 Origin: 0.058823529411764705 ../../models/2020_eng 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6768.15it/s] 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1277.90it/s] Cui count:1012 Origin: 0.022900763358778626 ../../models/2020_eng 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6711.85it/s] 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1298.26it/s] Cui count:1012 Origin: 0.010687022900763359 BETA ../../models/2020_eng 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6796.40it/s] 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1291.59it/s] Cui count:1012 may_treat: 0.0183206106870229 ../../models/2020_eng 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6778.01it/s] 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1295.40it/s] Cui count:1012 may_treat: 0.22442748091603054 ALL ../../embeddings/claims_codes_hs_300.txt Cui count:1013 1216it [06:14, 3.25it/s] Average: 0.3472199935815148 Max: 0.5396341463414634 ../../embeddings/GoogleNews-vectors-negative300.bin Tokenize 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 14792.48it/s] Calculate average word embedding 1012it [00:00, 18229.45it/s] Cui count:846 837it [03:33, 3.92it/s] Average: 0.06890856701103378 Max: 0.1213235294117647 ../../models/2020_eng 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1013/1013 [00:00<00:00, 6772.47it/s] 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1012/1012 [00:00<00:00, 1272.17it/s] Cui count:1012 1215it [06:20, 3.19it/s] Average: 0.22862564005905825 Max: 0.36946564885496186