apprentissage par renforcement
apprendimento per rinforzo
Form des maschinellen Lernens, bei der ein Agent in einer virtuellen Umgebung durch Versuch und Irrtum lernt.
Type of machine learning technique that enables an agent to learn in an interactive environment by trial and error using feedback from its own actions and experiences.
Apprentissage automatique dans lequel un programme extérieur évalue positivement ou négativement les résultats successifs de l'algorithme, l'accumulation des résultats permettant à l'algorithme d'améliorer ses performances jusqu'à ce qu'il atteigne un objectif préalablement fixé.
Algoritmo di apprendimento automatico che per tentativi ed errori determina in modo autonomo la massimizzazione della ricompensa per un obiettivo specifico.
2023-05-30T14:47:33.5642240Z
https://www.termdat.bk.admin.ch/entry/501290
CNAI - Kompetenznetzwerk für künstliche Intelligenz, 2021-12-15 ([Internet, 2022-12-20](https://cnai.swiss/wp-content/uploads/2023/04/CNAI_Terminologie_D_1_0.pdf))
CNAI - Competence Network for Artificial Intelligence, 2021-12-15 ([Internet, 2022-12-20](https://cnai.swiss/wp-content/uploads/2023/04/CNAI_Terminologie_E_1_0.pdf))
CNAI - Réseau de compétences en intelligence artificielle, 2021-12-15 ([Internet, 2022-12-20](https://cnai.swiss/wp-content/uploads/2023/04/CNAI_Terminologie_F_1_0.pdf))
CNAI - Rete di competenze per l’intelligenza artificiale, 2021-12-15 ([Internet, 2022-12-20](https://cnai.swiss/wp-content/uploads/2023/04/CNAI_Terminologie_I_1_0.pdf))
DOM: künstliche Intelligenz; EXP: durch das Ersetzen eines Mitarbeiters durch einen Agenten (Computerprogramm) können Ergebnisse basierend auf einer Feedbackschleife ermittelt werden
DOM: artificial intelligence; EXP: the goal is to find a suitable action model that would maximize the total cumulative reward of the agent
DOM: intelligence artificielle; EXP: l'apprentissage par renforcement est fréquemment utilisé dans la robotique; son efficacité a été attestée dans certains jeux stratégiques comme le jeu de go
DOM: intelligenza artificiale; EXP: il processo dell’apprendimento per rinforzo comprende la definizione e la simulazione dell’ambiente in cui opererà l’agente, la definizione del segnale di ricompensa e delle relative modalità di calcolo, la definizione della policy, quindi dell’algoritmo di addestramento, l’addestramento e la diffusione della policy individuata
BigData4Innovation, Reinforcement learning: cos’è, come funziona ed esempi dell’apprendimento per rinforzo ([2022-06-15, Internet](https://www.bigdata4innovation.it/intelligenza-artificiale/reinforcement-learning-cose-come-funziona-ed-esempi-dellapprendimento-per-rinforzo/))
Towards Data Science, Reinforcement Learning 101 ([Internet, 2023-03-20](https://towardsdatascience.com/reinforcement-learning-101-e24b50e1d292))
nach Microsoft Azure, Was ist Machine Learning? ([Internet, 2020-09-02](https://azure.microsoft.com/de-de/overview/what-is-machine-learning-platform/#benefits))
d'après Légifrance, Vocabulaire de l'intelligence artificielle, "apprentissage par renforcement", JORF n°0285, 2018-12-09 ([Internet, 2022-06-02](https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000037783813))
Lernen wie Maschinen, Was ist bestärkendes Lernen – oder Reinforcement Learning (RL)? ([Internet, 2020-09-02](https://www.lernen-wie-maschinen.ai/ki-pedia/was-ist-bestaerkendes-lernen-oder-reinforcement-learning-rl/))
after Towards Data Science, Reinforcement Learning 101 ([Internet, 2023-03-20](https://towardsdatascience.com/reinforcement-learning-101-e24b50e1d292))
Légifrance, Vocabulaire de l'intelligence artificielle, "apprentissage par renforcement", JORF n°0285, 2018-12-09 ([Internet, 2022-06-02](https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000037783813))
secondo BigData4Innovation, Reinforcement learning: cos’è, come funziona ed esempi dell’apprendimento per rinforzo ([2022-06-15, Internet](https://www.bigdata4innovation.it/intelligenza-artificiale/reinforcement-learning-cose-come-funziona-ed-esempi-dellapprendimento-per-rinforzo/))