# 题目

给定一个非空的整数数组,返回其中出现频率前 k 高的元素。

示例 1:

  • 输入: nums = [1,1,1,2,2,3], k = 2
  • 输出: [1,2]

示例 2:

  • 输入: nums = [1], k = 1
  • 输出: [1]

提示:

  • 你可以假设给定的 k 总是合理的,且 1 ≤ k ≤ 数组中不相同的元素的个数。
  • 你的算法的时间复杂度必须优于 O(nlogn)O(n \log n) , n 是数组的大小。
  • 题目数据保证答案唯一,换句话说,数组中前 k 个高频元素的集合是唯一的。
  • 你可以按任意顺序返回答案。

347. 前 K 个高频元素 - 力扣(LeetCode)

# 分析

这道题目主要涉及到如下三块内容:

  1. 要统计元素出现频率
  2. 对频率排序
  3. 找出前 K 个高频元素

首先统计元素出现的频率,这一类的问题可以使用 map 来进行统计。

然后是对频率进行排序,这里我们可以使用一种 容器适配器就是优先级队列

什么是优先级队列呢

优先级队列(Priority Queue)是一种特殊类型的队列,其中每个元素都有一个与之关联的优先级。具有较高优先级的元素在队列中排在较低优先级元素的前面。

优先级队列的特点是可以确保在插入或删除元素时,始终能够以适当的顺序处理具有最高优先级的元素。

通常,优先级队列使用堆(Heap)数据结构来实现,也可通过二叉搜索树等其他结构来实现。

优先级队列的常见操作包括插入(Insertion)、删除最大 / 最小元素(Delete Max/Min),以及查找最大 / 最小元素(Find Max/Min)等。这些操作的复杂度通常为 O (log n),其中 n 是队列中的元素数量。

优先级队列在很多应用中都有广泛的使用,如调度算法、图算法、模拟系统等,它能够高效地对元素进行排序和筛选。

什么是堆?

在数据结构中,堆(Heap)是一种特殊的树形数据结构,通常指的是二叉堆(Binary Heap),也称为最小堆(Min Heap)或最大堆(Max Heap)。

堆具有以下特性:

  1. 完全二叉树结构:堆是一种完全二叉树,即除了最后一层外,其他层都必须是满的,而在最后一层,所有节点都集中在左侧。
  2. 堆序性:在最小堆(最大堆)中,任意节点的值总是小于等于(大于等于)其子节点的值。

最小堆的特点是根节点的值最小,任意节点的值都小于或等于其子节点的值。最大堆的特点则是根节点的值最大,任意节点的值都大于或等于其子节点的值。

// 时间复杂度: O (nlogk)
// 空间复杂度: O (n)
class Solution {
public:
    // 小顶堆
    class mycomparison {
    public:
        bool operator()(const pair<int, int>& lhs, const pair<int, int>& rhs) {
            return lhs.second > rhs.second;
        }
    };
    vector<int> topKFrequent(vector<int>& nums, int k) {
        // 要统计元素出现频率
        unordered_map<int, int> map; //map<nums [i], 对应出现的次数 >
        for (int i = 0; i < nums.size(); i++) {
            map[nums[i]]++;
        }
        // 对频率排序
        // 定义一个小顶堆,大小为 k
        priority_queue<pair<int, int>, vector<pair<int, int>>, mycomparison> pri_que;
        // 用固定大小为 k 的小顶堆,扫面所有频率的数值
        for (unordered_map<int, int>::iterator it = map.begin(); it != map.end(); it++) {
            pri_que.push(*it);
            if (pri_que.size() > k) { // 如果堆的大小大于了 K,则队列弹出,保证堆的大小一直为 k
                pri_que.pop();
            }
        }
        // 找出前 K 个高频元素,因为小顶堆先弹出的是最小的,所以倒序来输出到数组
        vector<int> result(k);
        for (int i = k - 1; i >= 0; i--) {
            result[i] = pri_que.top().first;
            pri_que.pop();
        }
        return result;
    }
};