C. AI助教系统

    传统题 1000ms 256MiB

AI助教系统

该比赛已结束,您无法在比赛模式下递交该题目。您可以点击“在题库中打开”以普通模式查看和递交本题。

AI助教系统

题目描述

噜噜答疑系统的 AI 助教是基于大语言模型(英文:Large Language Model,缩写 LLM)来生成对话的,目前其计费以 Token 为单位。Token 是模型处理文本的最小单位,在本题中我们将其简单定义为一个单词或标点符号【不包括空格】。 AI 助教在与学生对话时,并不会记住自己之前的回答,而是将之前全部对话内容都当成一次输入,来生成新的回复。例如下列对话:

学生:Hello! Who are you?
AI:Hi!  I am AI, your teaching assistant.
学生:Now how can you help me?
AI:Anyway you like, except cheating.

在这段对话中:

  • 学生第一次输入了 66 个 Tokens(即“Hello”、“!”、“Who”、“are”、“you”、“?”);
  • AI 的第一次回答输出了 1010 个 Tokens;
  • 学生第二个问题虽然只有 77 个 Tokens,但 AI 第二次回答是基于前面三句话共 2323 个 Tokens 产生的,所以第二句话的输入是 6+10+7=236+10+7=23 个Tokens;
  • AI第二次输出的回答包含了 77 个 Tokens。

所以上述对话一共产生了 6+23=296+23=29 个输入的 Tokens,以及 10+7=1710+7=17 个输出的 Tokens。 对于给定的一段对话,本题就请你分别统计一下输入的和输出的 Token 量。

输入格式:

输入由若干行语句组成。 每行以 X: 开头(这两个字符不算在Token里边),其中 XS 代表这句话是学生输入的,为 A 代表这句话是 AI 助教输出的,为# 则表示对话结束(即这行不要处理,结束程序)。

随后的语句仅由英文字母和标点符号以及空格组成,最后以回车结束。

保证数据输入不超过10001000行,每行不超过100100个字符

输出格式:

在一行中输出 22 个数字,依次为本次对话产生的输入和输出的 Token 个数。数字间以1 1 个空格分隔。题目保证输出的 22 个数字均不超过 10710^7注意

1、本题定义 Token 为一个单词或标点符号。所谓“单词”,是指完全由英文字母组成的、连续不含空格和标点符号的字符串。

2、只有当 AI 产生回答的时候,这个回答之前的内容才作为输入进行统计。如果提问后没等 AI 回答就关闭了对话,则提问内容不算在输入 Token 里。

3、题目保证对话中没有连续的问和连续的答,只有一问跟一答。

S: Hello! Who are you?
A: Hi!  I am AI, your teaching assistant.
S: Now    how can you help me?
A: Anyway you like, except cheating.
S: Thank you!
A: You are welcome.
S: That is all.
#:
62 21

「果壳语法杯」ROUND #10 (Div.4)

未参加
状态
已结束
规则
IOI
题目
5
开始于
2025-7-11 18:00
结束于
2025-7-13 19:00
持续时间
2 小时
主持人
参赛人数
16