mirror of
https://github.com/ggerganov/llama.cpp.git
synced 2024-12-26 22:30:32 +01:00
92139b90af
* tests : add test-tokenizer-0.sh * unicode : add all unicode number ranges * starcoder : fix pre-tokenizer * tests : add test that fails with DeepSeek tokenizers * falcon : fix regex * unicode : regenerate unicode tables * refact : add tokenizer model * lint : fix * tests : disable failing tests ggml-ci * refact : add tests files ggml-ci * convert : print -> logging ggml-ci * lint : fix * unicode : digit -> number * phi-3 : update
44 lines
2.0 KiB
Plaintext
44 lines
2.0 KiB
Plaintext
1050 207 19 207 19192 4217
|
|
37 32009 71 6247
|
|
|
|
207
|
|
243
|
|
315
|
|
184
|
|
185
|
|
185 185
|
|
185 185 185
|
|
184 185
|
|
17535 1835
|
|
414 9489 1835
|
|
17535 5414
|
|
414 9489 5414
|
|
414 9489 5414 0
|
|
17535 11 1835 0
|
|
414 9489 11 1835 0
|
|
437 317 12394 99 234 13 14789
|
|
86 15 19 23 207 22 83 3963 27659 26078 3934 14072
|
|
1593 6478 616 2251 14994
|
|
155 239 209 155 239 114 155 239 228 155 240 220 155 239 224 155 240 211 155 239 231 155 239 115 155 239 240 155 240 210 155 239 240 155 239 95 155 239 114 155 239 214 155 239 210 155 239 236 155 239 214 155 240 210 155 239 218
|
|
10047 235 209 334 8760 8 12394 233 114 350 222 10047 221 104 169 116 224 334 4684 3909 992 24330 262 29651 612 8 207 156 237 214 334 5950 992 78 12896 344 638 891 1372 10736 8
|
|
17535
|
|
414 9489
|
|
207 414 9489
|
|
243 414 9489
|
|
315 414 9489
|
|
315 414 9489 185 315 414 9489
|
|
334
|
|
185 405
|
|
6 2895
|
|
17535 11 320 6 435 0 1717 417 340 12394 233 210 3015 19100 608 9413 2668 16 18 16 19 16 20 16 1393 169 121 239
|
|
18
|
|
18 18
|
|
18 18 18
|
|
18 18 18 18
|
|
18 18 18 18 18
|
|
18 18 18 18 18 18
|
|
18 18 18 18 18 18 18
|
|
18 18 18 18 18 18 18 18
|
|
18 18 18 18 18 18 18 18 18
|
|
185 207 185 185 207 185 185 185 207 12405 459 22758 185 243 185 315 185 251 185 730 185 10047 235 209 334 8760 8 12394 233 114 350 222 10047 221 104 169 116 224 334 4684 3909 992 24330 262 29651 612 8 207 156 237 214 12394 99 234 10047 99 234 207 18 207 18 18 207 18 18 18 207 18 18 18 18 207 18 18 18 18 18 207 18 18 18 18 18 18 207 18 18 18 18 18 18 18 207 18 18 18 18 18 18 18 18 207 18 13 18 207 18 524 18 207 18 1202 18 207 155 239 209 155 239 114 155 239 228 155 240 220 155 239 224 155 240 211 155 239 231 155 239 115 155 239 240 155 240 210 155 239 240 155 239 95 155 239 114 155 239 214 10047 233 210 3015 19100 608 9413 2668 16 18 16 19 16 20 16 1393 169 121 239 18155 374 17194 28 2861 6478 616 2251 14994 31269 4191 6 4686 4686 10252 3358 3358 3409 524 15330 3023 15031 5668 303 6 312 798 651 83 839 362 6 82 741 11 651 1369 340 2037 30 651 44 441 2037 303 6 642 1098 359 11 651 35 340 833 738 10860 30 998 6 10709 245 6 75 43
|