首先看chatgpt的算法:chatgpt采用rlhf学机制,用人工对模型输出的结果进行评分,需要消耗一定的人力,但是模型结果会更加符合人类偏好。
这种算法模式意味着chatgpt生成的结果只是我们的偏好,而不会生成创造性的结果,意味着它之所以能得到人们的赞赏是因为他们的回答基本满足我们的偏好。
但是我们真的应该满足于这吗,我觉得我们应该期待的是类似于AlphaGo在围棋中那些出人意料,让人捉摸不