Stochastic dynamic programming for resource allocation
Publiceringsdatum: 2005-01-01
Rapportnummer: FOI-R--1666--SE
Sidor: 18
Skriven på: Engelska
Nyckelord:
- Stokastisk dynamisk programmering
- sensorstyrning
- resursallokering
- simulering
- stochastic dynamic programming
- sensor management
- resource allocation
- simulation
Sammanfattning
Resursallokering är en viktig del i det framtida nätverksbaserade försvaret. För att uppnå tillräckligt bra lägesbilder krävs det att sensorplattformar skickas till rätt ställen och att rätt prioriteringar görs mellan olika användares behov. Andra viktiga problem som kräver resursallokering är t ex att bestämma var soldater eller ambulanser ska placeras. För att ta hänsyn till motståndarens framtida aktivitet när sensorstyrning görs krävs noggrann konsekvens- och riskanalys. Ett viktigt hjälpmedel vid sådan analys är stokastisk optimering. En viktig metod för sådan optimering är stokastisk dynamisk programmering, som kan användas för att beräkna bästa möjliga handlingsalternativ när vi har probabilistisk kännedom om motståndarens uppträdande. Även i de fall där man har stokastiska modeller för t ex tillförlitlighet i våra kommunikationsnät kan stokastisk dynamisk programmering användas. I den här rapporten beskriver vi grunderna för stokastisk dynamisk programmering samt dess relation till reinforcement learning. Vi beskriver också kort några relevanta tillämpningar från litteraturen samt ger förslag på framtida arbete inom området.