Perpustakaan yang ditulis dalam Cuda

instant-ngp

Primitif grafis saraf instan: NeRF secepat kilat dan banyak lagi.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

Proyek ini merupakan implementasi resmi makalah CVPR2019 kami "Pembelajaran Representasi Resolusi Tinggi Mendalam untuk Estimasi Pose Manusia".
  • 4.1k
  • MIT

cub

Primitif kooperatif untuk CUDA C++. (oleh NVIDIA).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph - Pustaka Analisis Grafik RAPIDS.
  • 1.3k
  • Apache License 2.0

blocksparse

Kernel GPU yang efisien untuk multiplikasi dan konvolusi matriks blok-jarang.
  • 948
  • MIT

k2

Algoritme FSA/FST, dapat dibedakan, dengan kompatibilitas PyTorch..
  • 927
  • Apache License 2.0

nv-wavenet

Implementasi referensi dari inferensi wavenet autoregresif real-time.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

Pengurai CSV berbasis GPU yang cepat.
  • 550
  • Apache License 2.0

instant-ngp-Windows

Primitif grafis saraf instan: NeRF secepat kilat dan banyak lagi.
  • 458
  • GNU General Public License v3.0

nccl-tests

Tes NCCL.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: Pustaka Terdistribusi Berbasis GPU untuk Penyesuaian Bundel Skala Besar.
  • 368
  • Apache License 2.0

raft

RAFT berisi algoritme dasar yang banyak digunakan dan primitif untuk ilmu data, grafik, dan pembelajaran mesin. (oleh rapidsai).
  • 278
  • Apache License 2.0

dietgpu

Implementasi GPU dari encoder dan dekoder entropi ANS (sistem angka asimetris) umum cepat, dengan ekstensi untuk kompresi lossless tipe data numerik dan lainnya dalam aplikasi HPC/ML..
  • 247
  • MIT

TorchPQ

Perkiraan pencarian tetangga terdekat dengan kuantisasi produk pada GPU di pytorch dan cuda.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

Versi CUDA dari model bahasa RWKV (https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

Implementasi CUDA dari algoritma Hierarchical Navigable Small World Graph.
  • 88
  • Apache License 2.0

CUB

REPOSITORI INI TELAH PINDAH KE github.com/nvidia/cub, YANG OTOMATIS MIRORED DI SINI..
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

Perbandingan bahasa array & perpustakaan: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC & ArrayFire..
  • 60
  • MIT

mish-cuda

Fungsi Aktivasi Mish untuk PyTorch (oleh JunnYu).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

Jalankan model XGBoost dan buat prediksi di Node.js.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

Mesin game berorientasi penelitian yang mengeksplorasi teknik rendering canggih (oleh vedavamadathil).
  • 21

CryptoGPU

Analisis harga Cryptocurrency.
  • 16

LSQR-CUDA

Ini adalah implementasi LSQR-CUDA yang ditulis oleh Lawrence Ayers di bawah pengawasan Stefan Guthe dari Institut GRIS di Technische Universität Darmstadt. Perpustakaan LSQR ditulis oleh Chris Paige dan Michael Saunders..
  • 11
  • MIT

SBNN

Jaringan Syaraf Binarisasi Tunggal berdasarkan Operasi Bit GPU (lihat makalah SC-19 kami).
  • 10
  • GNU General Public License v3.0

GCGT

Kode sumber untuk makalah: Traversal Grafik Terkompresi berbasis GPU.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

Simulator ini menghitung semua persimpangan yang mungkin untuk langkah waktu yang sangat kecil untuk model partikel.
  • 2

DOKSparse

tensor DOK jarang pada GPU, pytorch.
  • 1
  • MIT