为给定用户选择每个帖子的SO信誉

问题描述 投票:0回答:2

我目前正在为SEDE编写一个SQL查询,它从Stack Overflow中选择用户的所有帖子,并显示每个帖子生成的信誉量。

我无法理解的是如何计算每个帖子的所有upvotes,downvotes和accept,然后计算每个帖子的整体声誉收益。

因此,我想通过Post id分组展示Total score,并展示整体获得多少声誉。

每张投票产生的声誉可以在这里看到:

+-----------+----------+--------+
| Post type | Question | Answer |
+-----------+----------+--------+
| Upvote    |    5     |   10   |
+-----------+----------+--------+
| Downvote  |    2     |    2   |
+-----------+----------+--------+
| Accept    |    5     |   15   |
+-----------+----------+--------+

我定位的数据库架构可以找到here

到目前为止,我的查询如下所示:

select 
  p.Id as 'Post id', 
  pt.Name as 'Post type',
  p.Score as 'Total score',
  (
    case vt.Id
      when 1 then 'Accept'
      when 2 then 'Upvote'
      else 'Downvote'
      end
  ) as 'Reputation type'
from 
  Posts p
join 
  Votes v
on
  v.PostId = p.Id
join 
  VoteTypes vt
on 
  vt.Id = v.VoteTypeId
join
  PostTypes pt
on 
  pt.Id = p.PostTypeId
where
  p.OwnerUserId = ##UserId##
and 
  vt.Id in (1, 2, 3)
order by
  p.Score,
  vt.Id
asc

它产生的输出看起来像这样:

我试图通过Vote type id分组:

group by  
  vt.id

这样我至少可以通过以下方式找出每个帖子积累的不同票数:

select
  ....
  count(vt.id)

但后来我得到一个错误,即Posts.Id列无法解析:

可以找到当前可运行但不完整的查询here(您必须输入您的用户ID才能运行)

sql sql-server-2017 dataexplorer
2个回答
2
投票

每个帖子的声誉比这复杂一点。 除了上/下/接受投票,还有:

  1. 赏金,
  2. 代表帽,
  3. 用户的代表楼层(没有用户可以少于1个代表(通常))。
  4. 社区维基。
  5. 垃圾邮件或滥用标志。
  6. 根据网站的不同,Upvotes会根据问题计算不同的金额。
  7. 许多帖子根本没有投票,因此SQL需要反映这一点。 (左连接,COALESCE等)
  8. 你是否计算了一个帖子的批准建议编辑(2分代表)?
  9. 可能是我忘记的其他事情。

根据你的真实情况,你可以考虑使用this API method instead(然后用post_id对结果进行分组)。

无论如何,here's your query tuned up a bit

SELECT      p.Id      AS [Post Link]
            , pt.Name AS 'Post type'
            , p.Score AS 'Total score'
            , COALESCE (vtStats.AcceptRep, 0)   AS [Accept Rep]
            , COALESCE (vtStats.numUpvotes, 0)  *  (
                CASE  p.PostTypeId
                    WHEN  1  THEN  5  -- Questions on most sites
                    WHEN  2  THEN 10  -- Answers
                    ELSE  1  -- Should not happen, but don't zero out
                END
            ) AS [Up Vt Rep]
            , COALESCE (vtStats.DwnVtRep, 0)    AS [Dwn Vt Rep]
FROM        Posts p
LEFT JOIN   (
    SELECT      v.PostId
                , SUM (CASE v.VoteTypeId    WHEN 1  THEN 15  ELSE 0  END)   AS AcceptRep
                , SUM (CASE v.VoteTypeId    WHEN 3  THEN -2  ELSE 0  END)   AS DwnVtRep
                , SUM (CASE v.VoteTypeId    WHEN 2  THEN  1  ELSE 0  END)   AS numUpvotes -- Needs special handling
    FROM        Votes v
    WHERE       v.VoteTypeId IN (1, 2, 3 )
    GROUP BY    v.PostId
)
AS vtStats  ON  vtStats.PostId = p.Id
INNER JOIN  Posttypes pt    ON pt.Id = p.PostTypeId
WHERE       p.OwnerUserId = ##UserId:Int##
ORDER  BY   p.Score DESC
            , [Accept Rep] DESC
            , pt.Name

0
投票

你可以尝试这样的事情:

 select 
 p.Id as 'Post id', 
 pt.Name as 'Post type',
 SUM
 (
    case vt.Id
    when 1 then 15
    when 2 then 10
    else -2
    end
    ) as 'Total Score'
    .....
   GROUP BY P.Id, Pt.Name
   ORDER BY....
© www.soinside.com 2019 - 2024. All rights reserved.