mirror of
https://github.com/ggerganov/llama.cpp.git
synced 2024-10-31 15:10:16 +01:00
92139b90af
* tests : add test-tokenizer-0.sh * unicode : add all unicode number ranges * starcoder : fix pre-tokenizer * tests : add test that fails with DeepSeek tokenizers * falcon : fix regex * unicode : regenerate unicode tables * refact : add tokenizer model * lint : fix * tests : disable failing tests ggml-ci * refact : add tests files ggml-ci * convert : print -> logging ggml-ci * lint : fix * unicode : digit -> number * phi-3 : update
44 lines
1.8 KiB
Plaintext
44 lines
1.8 KiB
Plaintext
4833 225 38 225 143 140 17723
|
|
56 2006 3935 265
|
|
|
|
225
|
|
261
|
|
264
|
|
202
|
|
203
|
|
478
|
|
2831
|
|
15773
|
|
8279 5788
|
|
12000 5788
|
|
8279 10896
|
|
12000 10896
|
|
12000 10896 19
|
|
8279 30 5788 19
|
|
12000 30 5788 19
|
|
458 438 5945 118 252 32 3766
|
|
105 34 38 42 225 41 102 1707 12530 10180 1479 8278
|
|
39862 8372 1039 9446 40242 13852 2053 8949 12531 1520 10700
|
|
14574 227 14574 133 14574 246 30457 238 14574 242 30457 229 14574 249 14574 134 14574 258 30457 228 14574 258 14574 114 14574 133 14574 232 14574 228 14574 254 14574 232 30457 228 14574 236
|
|
3807 253 227 308 4382 27 18458 133 46113 44967 123 13868 308 12565 19775 33071 40824 733 27 41889 308 2585 22680 688 1401 2819 4369 2404 27
|
|
8279
|
|
12000
|
|
225 12000
|
|
261 12000
|
|
264 12000
|
|
264 12000 284 12000
|
|
308
|
|
203 280
|
|
25 34666
|
|
8279 30 533 25 464 19 4971 884 844 18458 228 1018 4982 13368 2909 9513 17827 35 37 35 38 35 39 35 11873 47838
|
|
37
|
|
37 37
|
|
37 37 37
|
|
37 37 37 37
|
|
37 37 37 37 37
|
|
37 37 37 37 37 37
|
|
37 37 37 37 37 37 37
|
|
37 37 37 37 37 37 37 37
|
|
37 37 37 37 37 37 37 37 37
|
|
334 719 8878 202 10885 4222 16104 28570 203 3807 253 227 308 4382 27 18458 133 46113 44967 123 13868 308 12565 19775 33071 40824 733 27 41889 5945 118 252 3807 118 252 225 37 225 37 37 225 37 37 37 225 37 37 37 37 225 37 37 37 37 37 225 37 37 37 37 37 37 225 37 37 37 37 37 37 37 225 37 37 37 37 37 37 37 37 225 37 32 37 225 37 497 37 225 37 1179 37 225 14574 227 14574 133 14574 246 30457 238 14574 242 30457 229 14574 249 14574 134 14574 258 30457 228 14574 258 14574 114 14574 133 14574 232 36628 228 1018 4982 13368 2909 9513 17827 35 37 35 38 35 39 35 11873 47838 20921 16623 13028 8372 1039 9446 40242 13852 2053 8949 12531 1520 10700 5881 9592 13299 914 31753 31359 9163 3202 35472 10397 439 4763 2583 330 102 1455 938 1182 2017 30 330 613 844 3654 49 330 63 646 3654 439 4621 1930 561 30 330 54 844 2124 1629 35993 49 2688 25 7709 312 25 94 62
|