P16031 [CSPro 33] 词频统计
题目背景
洛谷的测试数据仅供民间交流使用,非官方测试数据。官方评测链接:。
题目描述
在学习了文本处理后,小 P 对英语书中的 $n$ 篇文章进行了初步整理。具体来说,小 P 将所有的英文单词都转化为了整数编号。假设这 $n$ 篇文章中共出现了 $m$ 个不同的单词,则把它们从 $1$ 到 $m$ 进行编号。这样,每篇文章就简化为了一个整数序列,其中每个数都在 $1$ 到 $m$ 范围内。
现给出小 P 处理后的 $n$ 篇文章,对于每个单词 $i$($1 \le i \le m$),试统计:
1. 单词 $i$ 出现在了多少篇文章中?
2. 单词 $i$ 在全部文章中总共出现了几次?
输入格式
从标准输入读入数据。
输入共 $n + 1$ 行。
输入的第一行包含两个正整数 $n$ 和 $m$,分别表示文章篇数和单词编号上限。
输入的第 $i + 1$ 行($1 \le i \le n$)包含由空格分隔的若干整数,其中第一个整数 $l_i$ 表示第 $i$ 篇文章的长度(单词个数);接下来 $l_i$ 个整数表示对应的整数序列,序列中每个整数均在 $1$ 到 $m$ 范围内,各对应原文中的一个单词。
输出格式
输出到标准输出。
输出共 $m$ 行。
第 $i$ 行($1 \le i \le m$)输出由空格分隔的两个整数 $x_i$ 和 $y_i$,表示共有 $x_i$ 篇文章包含单词 $i$,总计出现次数为 $y_i$。
说明/提示
### 样例解释
单词 $2$ 在:
- 文章 $1$ 中出现两次;
- 文章 $3$ 中出现三次;
- 文章 $4$ 中出现一次。
因此 $x_2 = 3、y_2 = 6$。
### 子任务
全部的测试数据满足 $0 < n, m \le 100$,且每篇文章至少包含一个单词、最多不超过 $100$ 个单词($1 \le l_i \le 100$)。