Scholar

Debajoy Mukherjee

Google Scholar ID: Tyhed3QAAAAJ

PhD Computer Science

Reinforcement learninglarge language models

Google Scholar↗

Citations & Impact

All-time

Citations

38

H-index

2

i10-index

1

Publications

5

Co-authors

1

list available

Contact

No contact links provided.

Publications

2 items

MAVIS: Multi-Objective Alignment via Value-Guided Inference-Time Search

2025

Cited

0

DOPL: Direct Online Preference Learning for Restless Bandits with Preference Feedback

International Conference on Learning Representations · 2024

Cited

2

Resume (English only)

Co-authors

1 total

Doctoral Candidate, Texas A&M University