智能建筑實現了供暖、通風和空調(HVAC)、照明、電力和安全等系統的自動化。自動化需要感知數據,如室內外溫度和濕度、二氧化碳濃度和居住狀態。智能建筑利用數據結合各種技術,可以使其更加節能。由于暖通空調系統占建筑物能源使用量的近一半,因此智能建筑使用智能恒溫器來自動控制暖通空調,并自動學習建筑物住戶的溫度偏好。

來自麻省理工學院信息與決策系統實驗室(LIDS)的研究人員與Skoltech科學家合作,設計了一種新型智能恒溫器,它使用數據高效算法,可以在一周內學習最佳溫度閾值。研究成果發表在《Applied Energy》雜志上。
為了加快學習過程,研究人員使用了一種名為流形學習(manifold learning)的方法,其中復雜和 "高維 "的函數被稱為 "流形 "的較簡單和較低維的函數所代表。通過利用流形學習和建筑熱力學知識,研究人員用一組 "閾值 "策略取代了一種通用的控制方法,這種控制方法可以有很多參數,每個策略都有更少、更可解釋的參數。為學習最佳流形而開發的算法需要更少的數據,因此它們的數據效率更高。
為恒溫器開發的算法采用了一種叫做強化學習(RL)的方法,這是一種數據驅動的順序決策和控制方法,近年來在雙陸棋和圍棋等游戲方面備受關注。
智能恒溫器的新RL算法是 "事件觸發 "的,這意味著它們只有在某些事件發生時才會做出決定,而不是按照預先確定的時間表。這些 "事件 "是由某些條件達到閾值來定義的,例如房間里的溫度跌出最佳范圍。這使得學習更新的頻率降低,降低了算法計算成本。
研究人員認為他們的方法和算法還適用于其他各種基于物理學的控制問題,如機器人、自動駕駛車輛和交通等領域,在這些領域,數據和計算效率至關重要。
論文標題為《Data-driven control of micro-climate in buildings: An event-triggered reinforcement learning approach》。