Proceedings of 5th International Workshop on Parallel and Distributed Systems: Testing and Debugging Modelling - PADTAD'07
Healing Data Races On-The-Fly
London
2007-07-09
Concurrency, Testing, Self-Healing
Křena, Bohuslav
Letko, Zdeněk
Ur, Shmuel
Vojnar, Tomáš
Tzoref, Rachel
Association for Computing Machinery
978-1-59593-734-6
54-64

Testing of concurrent software is extremely difficult. Despite all the progress in the testing and verification technology, concurrent bugs, the most common of which are deadlocks and races, make it to the field. This paper describes a set of techniques, implemented in a tool called ConTest, allowing concurrent programs to self-heal at run-time.

Concurrent bugs have the very desirable property for healing that some of the interleaving produce correct results while in others bugs manifest. Healing concurrency problems is about limiting, or changing the probability of interleaving, such that bugs will be seen less.  When healing concurrent programs, if a deadlock does not result from limiting the interleaving, we are sure that the result of the healed program could have been in the original program and therefore no new functional bug has been introduced.

In this initial work which deals with different types of data races, we suggest three types of healing mechanisms:  (1)changing the"@en . "3"^^ . "RIV/00216305:26230/07:PU70824" . . . "Auto\u0159i se domn\u00EDvaj\u00ED, \u017Ee p\u0159ekladem textu se m\u00EDrn\u011B pozm\u011Bn\u00ED jeho p\u016Fvodn\u00ED smysl. Zejm\u00E9na problematick\u00FD je p\u0159eklad odborn\u00FDch term\u00EDn\u016F, kter\u00E9 nemaj\u00ED v \u010De\u0161tin\u011B za\u017Eit\u00FD ekvivalent. Nap\u0159\u00EDklad slovo "concurrent" lze p\u0159elo\u017Eit p\u0159esn\u011B jako "soub\u011B\u017En\u00FD" nebo jako l\u00E9pe zn\u011Bj\u00EDc\u00ED ale nep\u0159esn\u00E9 "paraleln\u00ED". Lze proto \u010Dten\u00E1\u0159i doporu\u010Dit, pokud to dovoluj\u00ED jeho znalosti angli\u010Dtiny, aby si p\u0159e\u010Detl abstrakt v p\u016Fvodn\u00EDm anglick\u00E9m zn\u011Bn\u00ED.

Testov\u00E1n\u00ED soub\u011B\u017En\u00FDch program\u016F je velice n\u00E1ro\u010Dn\u00E9. Chyby souvisej\u00EDc\u00ED se soub\u011B\u017Enost\u00ED se proto i p\u0159es zna\u010Dn\u00FD pokrok v oblasti testov\u00E1n\u00ED a ov\u011B\u0159ov\u00E1n\u00ED pom\u011Brn\u011B \u010Dasto dost\u00E1vaj\u00ED a\u017E k z\u00E1kazn\u00EDkovi. V tomto \u010Dl\u00E1nku pop\u00ED\u0161eme techniky vyvinut\u00E9 v r\u00E1mci n\u00E1stroje ConTest pro automatickou opravu chyb za b\u011Bhu soub\u011B\u017En\u00FDch program\u016F.

Autoři se domnívají, že překladem textu se mírně pozmění jeho původní smysl. Zejména problematický je překlad odborných termínů, které nemají v češtině zažitý ekvivalent. Například slovo "concurrent" lze přeložit přesně jako "souběžný" nebo jako lépe znějící ale nepřesné "paralelní". Lze proto čtenáři doporučit, pokud to dovolují jeho znalosti angličtiny, aby si přečetl abstrakt v původním anglickém znění.

Testování souběžných programů je velice náročné. Chyby související se souběžností se proto i přes značný pokrok v oblasti testování a ověřování poměrně často dostávají až k zákazníkovi. V tomto článku popíšeme techniky vyvinuté v rámci nástroje ConTest pro automatickou opravu chyb za běhu souběžných programů.

Souběžné chyby mají jednu velice užitečnou vlastnost pro automatickou opravu programů, a to, že se projevují po

