Jag accepterar att kakor lagras på min dator

Läs mer

Stochastic dynamic programming for resource allocation.

Stochastic dynamic programming for resource allocation. Beställ tryckt exemplar Lägg i kundvagnen Ladda ned som PDF
Författare: Johansson Ronnie, Mårtenson Christian, Suzic Robert, Svensson Pontus
Ort: Stockholm
Sidor: 18
Utgivningsår: 2005
Publiceringsdatum: 2005-01-01
Rapportnummer: (FOI-R--1666--SE)
Nyckelord Stokastisk dynamisk programmering, sensorstyrning, resursallokering, simulering, stochastic dynamic programming, sensor management, resource allocation, simulation
Sammanfattning Resursallokering är en viktig del i det framtida nätverksbaserade försvaret. För att uppnå tillräckligt bra lägesbilder krävs det att sensorplattformar skickas till rätt ställen och att rätt prioriteringar görs mellan olika användares behov. Andra viktiga problem som kräver resursallokering är t ex att bestämma var soldater eller ambulanser ska placeras. För att ta hänsyn till motståndarens framtida aktivitet när sensorstyrning görs krävs noggrann konsekvens- och riskanalys. Ett viktigt hjälpmedel vid sådan analys är stokastisk optimering. En viktig metod för sådan optimering är stokastisk dynamisk programmering, som kan användas för att beräkna bästa möjliga handlingsalternativ när vi har probabilistisk kännedom om motståndarens uppträdande. Även i de fall där man har stokastiska modeller för t ex tillförlitlighet i våra kommunikationsnät kan stokastisk dynamisk programmering användas. I den här rapporten beskriver vi grunderna för stokastisk dynamisk programmering samt dess relation till reinforcement learning. Vi beskriver också kort några relevanta tillämpningar från litteraturen samt ger förslag på framtida arbete inom området.
Abstract Resource allocation and management is an important part of the future network-based defence. In order to provide an adequate situation picture for commanders in the field, sensor platforms must be guided correctly and the needs of different users must be prioritized correctly. Other important problems which require resource allocation include determining where soldiers should be posted in order to maintain peace in an area and determining where to place ambulances. In order for sensor allocation to take opponent´s future activities into account, detailed analysis of risks and consequences is needed. An important help for doing this is stochastic optimization. One important method for such optimization is stochastic dynamic programming, which can be used to compute the best possible policy when we have a probabilistic model of the opponent´s behaviour. The method can also be used when we have stochastic models for, e.g., reliability of our own communication networks. In this report, we describe the basic methods and algorithms of stochastic dynamic programming and their relation to reinforcement learning. We also give a short overview of some relevant applications from the literature and suggest future work in this area.

Kundvagn

Inga rapporter i kundvagnen

FOI, Totalförsvarets forskningsinstitut

FOI
Totalförsvarets forskningsinstitut
164 90 Stockholm

Tel: 08-555 030 00
Fax: 08-555 031 00

Orgnr: 202100-5182