sched: Queue all free credits in one worker invocation

Tvrtko Ursulin Mon, 31 Mar 2025 13:18:01 -0700

There is no reason to queue just a single job if scheduler can take more
and re-queue the worker to queue more. We can simply feed the hardware
with as much as it can take in one go and hopefully win some latency.


Signed-off-by: Tvrtko Ursulin <tvrtko.ursu...@igalia.com>
Cc: Christian König <christian.koe...@amd.com>
Cc: Danilo Krummrich <d...@kernel.org>
Cc: Matthew Brost <matthew.br...@intel.com>
Cc: Philipp Stanner <pha...@kernel.org>
---
 drivers/gpu/drm/scheduler/sched_internal.h |   2 -
 drivers/gpu/drm/scheduler/sched_main.c     | 127 ++++++++++-----------
 drivers/gpu/drm/scheduler/sched_rq.c       |  17 +--
 3 files changed, 61 insertions(+), 85 deletions(-)

diff --git a/drivers/gpu/drm/scheduler/sched_internal.h 
b/drivers/gpu/drm/scheduler/sched_internal.h
index fc0f05ce06af..4b3fc4a098bb 100644
--- a/drivers/gpu/drm/scheduler/sched_internal.h
+++ b/drivers/gpu/drm/scheduler/sched_internal.h
@@ -4,8 +4,6 @@
 #define _DRM_GPU_SCHEDULER_INTERNAL_H_
 
 
-bool drm_sched_can_queue(struct drm_gpu_scheduler *sched,
-                        struct drm_sched_entity *entity);
 void drm_sched_wakeup(struct drm_gpu_scheduler *sched);
 
 void drm_sched_rq_init(struct drm_gpu_scheduler *sched,
diff --git a/drivers/gpu/drm/scheduler/sched_main.c 
b/drivers/gpu/drm/scheduler/sched_main.c
index b35450c45e7b..8aaa6a0dcc70 100644
--- a/drivers/gpu/drm/scheduler/sched_main.c
+++ b/drivers/gpu/drm/scheduler/sched_main.c
@@ -100,35 +100,6 @@ static u32 drm_sched_available_credits(struct 
drm_gpu_scheduler *sched)
        return credits;
 }
 
-/**
- * drm_sched_can_queue -- Can we queue more to the hardware?
- * @sched: scheduler instance
- * @entity: the scheduler entity
- *
- * Return true if we can push at least one more job from @entity, false
- * otherwise.
- */
-bool drm_sched_can_queue(struct drm_gpu_scheduler *sched,
-                        struct drm_sched_entity *entity)
-{
-       struct drm_sched_job *s_job;
-
-       s_job = drm_sched_entity_queue_peek(entity);
-       if (!s_job)
-               return false;
-
-       /* If a job exceeds the credit limit, truncate it to the credit limit
-        * itself to guarantee forward progress.
-        */
-       if (s_job->credits > sched->credit_limit) {
-               dev_WARN(sched->dev,
-                        "Jobs may not exceed the credit limit, truncate.\n");
-               s_job->credits = sched->credit_limit;
-       }
-
-       return drm_sched_available_credits(sched) >= s_job->credits;
-}
-
 /**
  * drm_sched_run_job_queue - enqueue run-job work
  * @sched: scheduler instance
@@ -945,54 +916,72 @@ static void drm_sched_run_job_work(struct work_struct *w)
 {
        struct drm_gpu_scheduler *sched =
                container_of(w, struct drm_gpu_scheduler, work_run_job);
+       u32 job_credits, submitted_credits = 0;
        struct drm_sched_entity *entity;
-       struct dma_fence *fence;
        struct drm_sched_fence *s_fence;
        struct drm_sched_job *sched_job;
-       int r;
+       struct dma_fence *fence;
 
-       /* Find entity with a ready job */
-       entity = drm_sched_rq_select_entity(sched, sched->rq);
-       if (IS_ERR_OR_NULL(entity))
-               return; /* No more work */
+       while (!READ_ONCE(sched->pause_submit)) {
+               /* Find entity with a ready job */
+               entity = drm_sched_rq_select_entity(sched, sched->rq);
+               if (!entity)
+                       break;  /* No more work */
+
+               /*
+                * If a job exceeds the credit limit truncate it to guarantee
+                * forward progress.
+                */
+               sched_job = drm_sched_entity_queue_peek(entity);
+               job_credits = sched_job->credits;
+               if (dev_WARN_ONCE(sched->dev, job_credits > sched->credit_limit,
+                                 "Jobs may not exceed the credit limit, 
truncating.\n"))
+                       job_credits = sched_job->credits = sched->credit_limit;
+
+               if (job_credits > drm_sched_available_credits(sched)) {
+                       complete_all(&entity->entity_idle);
+                       break;
+               }
+
+               sched_job = drm_sched_entity_pop_job(entity);
+               if (!sched_job) {
+                       /* Top entity is not yet runnable after all */
+                       complete_all(&entity->entity_idle);
+                       continue;
+               }
+
+               s_fence = sched_job->s_fence;
+               drm_sched_job_begin(sched_job);
+               trace_drm_run_job(sched_job, entity);
+               submitted_credits += job_credits;
+               atomic_add(job_credits, &sched->credit_count);
+
+               fence = sched->ops->run_job(sched_job);
+               drm_sched_fence_scheduled(s_fence, fence);
+
+               if (!IS_ERR_OR_NULL(fence)) {
+                       int r;
+
+                       /* Drop for original kref_init of the fence */
+                       dma_fence_put(fence);
+
+                       r = dma_fence_add_callback(fence, &sched_job->cb,
+                                                  drm_sched_job_done_cb);
+                       if (r == -ENOENT)
+                               drm_sched_job_done(sched_job, fence->error);
+                       else if (r)
+                               DRM_DEV_ERROR(sched->dev,
+                                             "fence add callback failed 
(%d)\n", r);
+               } else {
+                       drm_sched_job_done(sched_job, IS_ERR(fence) ?
+                                                     PTR_ERR(fence) : 0);
+               }
 
-       sched_job = drm_sched_entity_pop_job(entity);
-       if (!sched_job) {
                complete_all(&entity->entity_idle);
-               drm_sched_run_job_queue(sched);
-               return;
        }
 
-       s_fence = sched_job->s_fence;
-
-       atomic_add(sched_job->credits, &sched->credit_count);
-       drm_sched_job_begin(sched_job);
-
-       trace_drm_run_job(sched_job, entity);
-       /*
-        * The run_job() callback must by definition return a fence whose
-        * refcount has been incremented for the scheduler already.
-        */
-       fence = sched->ops->run_job(sched_job);
-       complete_all(&entity->entity_idle);
-       drm_sched_fence_scheduled(s_fence, fence);
-
-       if (!IS_ERR_OR_NULL(fence)) {
-               r = dma_fence_add_callback(fence, &sched_job->cb,
-                                          drm_sched_job_done_cb);
-               if (r == -ENOENT)
-                       drm_sched_job_done(sched_job, fence->error);
-               else if (r)
-                       DRM_DEV_ERROR(sched->dev, "fence add callback failed 
(%d)\n", r);
-
-               dma_fence_put(fence);
-       } else {
-               drm_sched_job_done(sched_job, IS_ERR(fence) ?
-                                  PTR_ERR(fence) : 0);
-       }
-
-       wake_up(&sched->job_scheduled);
-       drm_sched_run_job_queue(sched);
+       if (submitted_credits)
+               wake_up(&sched->job_scheduled);
 }
 
 /**
diff --git a/drivers/gpu/drm/scheduler/sched_rq.c 
b/drivers/gpu/drm/scheduler/sched_rq.c
index 21ee96a37895..735bcb194c03 100644
--- a/drivers/gpu/drm/scheduler/sched_rq.c
+++ b/drivers/gpu/drm/scheduler/sched_rq.c
@@ -164,9 +164,7 @@ void drm_sched_rq_pop_entity(struct drm_sched_entity 
*entity)
  *
  * Find oldest waiting ready entity.
  *
- * Return an entity if one is found; return an error-pointer (!NULL) if an
- * entity was ready, but the scheduler had insufficient credits to accommodate
- * its job; return NULL, if no ready entity was found.
+ * Return an entity if one is found or NULL if no ready entity was found.
  */
 struct drm_sched_entity *
 drm_sched_rq_select_entity(struct drm_gpu_scheduler *sched,
@@ -185,17 +183,8 @@ drm_sched_rq_select_entity(struct drm_gpu_scheduler *sched,
        }
        spin_unlock(&rq->lock);
 
-       if (!entity)
-               return NULL;
-
-       /*
-        * If scheduler cannot take more jobs signal the caller to not consider
-        * lower priority queues.
-        */
-       if (!drm_sched_can_queue(sched, entity))
-               return ERR_PTR(-ENOSPC);
-
-       reinit_completion(&entity->entity_idle);
+       if (entity)
+               reinit_completion(&entity->entity_idle);
 
        return entity;
 }
-- 
2.48.0

[RFC v3 11/14] drm/sched: Queue all free credits in one worker invocation

Reply via email to