openpilot_comma/tinygrad_repo/extra/gemm/tvm_gemm.py

# https://tvm.apache.org/docs/tutorial/tensor_expr_get_started.html#example-2-manually-optimizing-matrix-multiplication-with-te

M, N, K = 1024, 1024, 1024

try:
  import tvm
  from tvm import te
  #print(tvm.target.Target.list_kinds())

  # c, opencl
  target = tvm.target.Target(target="c")

  # TVM Matrix Multiplication using TE
  k = te.reduce_axis((0, K), "k")
  A = te.placeholder((M, K), name="A")
  B = te.placeholder((K, N), name="B")
  C = te.compute((M, N), lambda x, y: te.sum(A[x, k] * B[k, y], axis=k), name="C")

  # Default schedule
  s = te.create_schedule(C.op)
  #print(tvm.lower(s, [A, B, C], simple_mode=True))

  # Output C code
  func = tvm.build(s, [A, B, C], target=target, name="mmult")
  print(func.get_source())
except ImportError:
  print("** please install TVM for TVM output")

# tinygrad version

import os
from tinygrad.tensor import Tensor

# define the compute
A = Tensor.rand(M, K, device="CPU")
B = Tensor.rand(K, N, device="CPU")
C = (A.reshape(M, 1, K) * B.permute(1,0).reshape(1, N, K)).sum(axis=2)

sched = C.schedule()
from tinygrad.codegen.kernel import Kernel
from tinygrad.device import CompilerOptions
lin = Kernel(sched[-1].ast, CompilerOptions(has_local=False, supports_float4=False))
#lin.hand_coded_optimizations()
lin.linearize()
from tinygrad.runtime.ops_cpu import renderer
src = renderer("mmult", lin.uops)
print(src)
openpilot v0.9.8 release date: 2025-03-15T21:10:51 master commit: fb7b9c0f9420d228f03362970ebcfb7237095cf3 3 months ago			`# https://tvm.apache.org/docs/tutorial/tensor_expr_get_started.html#example-2-manually-optimizing-matrix-multiplication-with-te`

			`M, N, K = 1024, 1024, 1024`

			`try:`
			`import tvm`
			`from tvm import te`
			`#print(tvm.target.Target.list_kinds())`

			`# c, opencl`
			`target = tvm.target.Target(target="c")`

			`# TVM Matrix Multiplication using TE`
			`k = te.reduce_axis((0, K), "k")`
			`A = te.placeholder((M, K), name="A")`
			`B = te.placeholder((K, N), name="B")`
			`C = te.compute((M, N), lambda x, y: te.sum(A[x, k] * B[k, y], axis=k), name="C")`

			`# Default schedule`
			`s = te.create_schedule(C.op)`
			`#print(tvm.lower(s, [A, B, C], simple_mode=True))`

			`# Output C code`
			`func = tvm.build(s, [A, B, C], target=target, name="mmult")`
			`print(func.get_source())`
			`except ImportError:`
			`print("** please install TVM for TVM output")`

			`# tinygrad version`

			`import os`
			`from tinygrad.tensor import Tensor`

			`# define the compute`
openpilot v0.9.9 release date: 2025-05-08T09:09:58 master commit: 52669b6ad2ff025b73b4a10bc45f3066e0adefb8 3 weeks ago			`A = Tensor.rand(M, K, device="CPU")`
			`B = Tensor.rand(K, N, device="CPU")`
openpilot v0.9.8 release date: 2025-03-15T21:10:51 master commit: fb7b9c0f9420d228f03362970ebcfb7237095cf3 3 months ago			`C = (A.reshape(M, 1, K) * B.permute(1,0).reshape(1, N, K)).sum(axis=2)`

openpilot v0.9.9 release date: 2025-05-08T09:09:58 master commit: 52669b6ad2ff025b73b4a10bc45f3066e0adefb8 3 weeks ago			`sched = C.schedule()`
openpilot v0.9.8 release date: 2025-03-15T21:10:51 master commit: fb7b9c0f9420d228f03362970ebcfb7237095cf3 3 months ago			`from tinygrad.codegen.kernel import Kernel`
			`from tinygrad.device import CompilerOptions`
			`lin = Kernel(sched[-1].ast, CompilerOptions(has_local=False, supports_float4=False))`
			`#lin.hand_coded_optimizations()`
			`lin.linearize()`
openpilot v0.9.9 release date: 2025-05-08T09:09:58 master commit: 52669b6ad2ff025b73b4a10bc45f3066e0adefb8 3 weeks ago			`from tinygrad.runtime.ops_cpu import renderer`
openpilot v0.9.8 release date: 2025-03-15T21:10:51 master commit: fb7b9c0f9420d228f03362970ebcfb7237095cf3 3 months ago			`src = renderer("mmult", lin.uops)`
			`print(src)`