2 9 10

Abdullah

amirali1985

amirabdullah19852020

AI & ML interests

Mechanistic interpretability, high dimensional geometry, persona role playing.

Recent Activity

updated a model about 5 hours ago

thoughtworks/arithmetic-sorl

updated a dataset about 5 hours ago

thoughtworks/arithmetic-sorl-data

published a dataset about 5 hours ago

thoughtworks/arithmetic-sorl-data

View all activity

Organizations

Collections 2

Papers 1

arxiv:2310.08164

spaces 2

PSL for minimal circuits.

📚

Visualize and analyze circuit minimality rules

Interpreting Reward Models

🦀

models 15

datasets 25

amirali1985/convsersations_sadness_llama3.1-8B-it_large

Viewer • Updated 8 days ago • 9.78k • 35

amirali1985/convsersations_excitement_llama3.1-8B-it_large

Viewer • Updated 8 days ago • 8k • 38

amirali1985/convsersations_rude_llama3.1-8B-it_large

Viewer • Updated 8 days ago • 15.9k • 42

amirali1985/convsersations_humor_llama3.1-8B-it_large

Viewer • Updated 8 days ago • 9.63k • 47

amirali1985/convsersations_corrigible_more_llama3.1-8B-it_large

Viewer • Updated 8 days ago • 8.27k • 40

amirali1985/convsersations_power_seeking_llama3.1-8B-it_large

Viewer • Updated 8 days ago • 8.27k • 55

amirali1985/convsersations_wealth_seeking_llama3.1-8B-it_large

Viewer • Updated 8 days ago • 11.4k • 41

amirali1985/convsersations_self_awareness_general_llama3.1-8B-it_large

Viewer • Updated 8 days ago • 13.4k • 54

amirali1985/llama3.2-1B-it_power_seeking_layer10

Viewer • Updated 10 days ago • 8.27k • 27

amirali1985/synthetic-shapes-3x6x7

Viewer • Updated 14 days ago • 13.2k • 70 • 1

View 25 datasets