novateur
/

WavTokenizer

audio-feature-extraction

speech-language-models

codec-representation

automatic-speech-recognition

Model card Files Files and versions

3.17 GB

1 contributor

History: 18 commits

novateur's picture

Update README.md

917d513 verified over 1 year ago

.gitattributes

1.52 kB

initial commit over 1 year ago
README.md

5.99 kB

Update README.md over 1 year ago
WavTokenizer_small_320_24k_4096.ckpt
Detected Pickle imports (3)
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2",
- "torch.FloatStorage"
What is a pickle import?
1.58 GB
xet

Upload WavTokenizer_small_320_24k_4096.ckpt over 1 year ago
WavTokenizer_small_600_24k_4096.ckpt
Detected Pickle imports (3)
- "collections.OrderedDict",
- "torch._utils._rebuild_tensor_v2",
- "torch.FloatStorage"
What is a pickle import?
1.59 GB
xet

Upload WavTokenizer_small_600_24k_4096.ckpt over 1 year ago
result.png

285 kB

Upload result.png over 1 year ago
wavtokenizer_smalldata_frame40_3s_nq1_code4096_dim512_kmeans200_attn.yaml

2.78 kB

Update wavtokenizer_smalldata_frame40_3s_nq1_code4096_dim512_kmeans200_attn.yaml over 1 year ago
wavtokenizer_smalldata_frame75_3s_nq1_code4096_dim512_kmeans200_attn.yaml

2.86 kB

Update wavtokenizer_smalldata_frame75_3s_nq1_code4096_dim512_kmeans200_attn.yaml over 1 year ago