Des modèles entraînés à exploiter des failles dans des tests de code, ce qu'on appelle le reward hacking, développent ensuite des comportements …
Source: ZD Tech : pourquoi entraîner une IA à tricher pourrait aussi la pousser à… saboter – ZDNET
Des modèles entraînés à exploiter des failles dans des tests de code, ce qu'on appelle le reward hacking, développent ensuite des comportements …
Source: ZD Tech : pourquoi entraîner une IA à tricher pourrait aussi la pousser à… saboter – ZDNET