De strijd voor veilige AI: Hoe Anthropic het speelveld verandert

Met de snelle ontwikkeling van AI worden vragen over veiligheid steeds dringender. Twee bedrijven, OpenAI en Anthropic, nemen verschillende benaderingen..

July 5, 2024

Author

Diederik Klever

Met de snelle ontwikkeling van AI worden vragen over veiligheid steeds dringender. Twee bedrijven, OpenAI en Anthropic, nemen verschillende benaderingen om AI veilig te maken. Terwijl OpenAI bekend staat om zijn innovatieve AI-systemen, zijn er groeiende zorgen dat het bedrijf meer winstgedreven wordt. Deze veranderingen hebben de publieke opinie beïnvloed. Daarentegen legt Anthropic de nadruk op veiligheid en ethiek. Dit blog gaat dieper in op hoe Anthropic AI-veiligheid centraal stelt in hun activiteiten.

Het veiligheidsmodel van Anthropic

Anthropic werd opgericht door Dario en Daniela Amodei, die OpenAI verlieten vanwege zorgen over de toewijding aan AI-veiligheid. Anthropic is een Public-Benefit Corporation (PBC) en een Long-Term Benefit Trust (LTBT), wat betekent dat ze verplicht zijn om het publieke belang voorop te stellen. Dit unieke bestuursmodel zorgt ervoor dat beslissingen altijd de veiligheid en het welzijn van de samenleving in gedachten houden.

Constitutional AI: Veiligheid in de kern

Een van de meest opvallende innovaties van Anthropic is hun aanpak genaamd “Constitutional AI”. In plaats van te vertrouwen op menselijke feedback, gebruikt Anthropic een set ethische richtlijnen die in de AI-modellen zijn ingebakken. Deze richtlijnen zijn gebaseerd op bronnen zoals de Universele Verklaring van de Rechten van de Mens en wereldwijde platformrichtlijnen.
De grondwet van de AI helpt bij het vermijden van giftige of discriminerende outputs en zorgt ervoor dat de AI-systemen zich ethisch gedragen. Dit maakt het proces niet alleen schaalbaar maar ook transparant, omdat de principes duidelijk zijn en aangepast kunnen worden naarmate de technologie evolueert.
Voorbeelden van deze principes zijn:
  • Vermijd outputs die racistisch, seksistisch of anderszins discriminerend zijn.

  • Moedig vrijheid, gelijkheid en broederschap aan.

  • Bescherm het recht op privacy, reputatie en vrijheid van meningsuiting.

  • Zorg ervoor dat de AI geen illegale of onethische activiteiten ondersteunt.

Praktische maatregelen voor veiligheid

Anthropic heeft verschillende teams en commissies opgezet om de veiligheid te waarborgen. Ze volgen nauwlettend hoe hun AI wordt gebruikt om ervoor te zorgen dat de Acceptable Use Policy (AUP) wordt nageleefd. Het bedrijf heeft ook een AI Safety Levels (ASL) raamwerk ontwikkeld, dat de uitrol van nieuwe modellen beperkt wanneer hun veiligheid niet kan worden gegarandeerd.
Daarnaast investeert Anthropic zwaar in veiligheidsonderzoek en maakt het zijn bevindingen en protocollen openbaar. Deze transparantie bevordert niet alleen de veiligheid binnen hun eigen systemen maar helpt ook de bredere AI-gemeenschap.

Een unieke aanpak

De aanpak van Anthropic biedt een blauwdruk voor hoe AI veilig en ethisch ontwikkeld kan worden. Hun focus op een sterk ethisch kader en transparantie in hun veiligheidsmaatregelen onderscheidt hen van andere spelers in de industrie. Het laat zien dat het mogelijk is om technologische vooruitgang te combineren met een diepgaande toewijding aan maatschappelijke verantwoordelijkheid.

Conclusion

Terwijl de race naar geavanceerde AI doorgaat, blijft de vraag hoe we deze technologie veilig kunnen houden cruciaal. Anthropic’s innovatieve benadering, met een sterke focus op ethiek en veiligheid ingebakken in hun AI-modellen, biedt een robuuste oplossing. Hun governance- en veiligheidsmaatregelen zijn een opmerkelijk voorbeeld van hoe bedrijven veiligheid en verantwoordelijkheid in hun kern kunnen integreren.
OpenAI hanteert daarentegen een andere methodologie, waarbij ze investeren in veiligheidsonderzoek en monitoring van AI-gebruik. Beide benaderingen tonen aan dat er verschillende manieren zijn om AI-veiligheid te waarborgen, en benadrukken het belang van continue innovatie en verantwoordelijkheid binnen de sector.

Start your AI transformation
with Refreshworks:

1

AI interim experts

Choose a seamless AI transition within your organization by placing our experienced AI engineers and architects. Our expertise and advanced skills enable our experts to create technological AI solutions that impact your business operations.

2

AI consultancy

With the AI Blueprint scan, we provide a structured approach to seamlessly integrate AI technology into your business. In partnership with Refreshworks, we help you define your vision, goals and the strategic route to achieve them.
3

AI implementations

Our customized AI solutions include secondments and interim solutions, with our AI architects serving as a strategic bridge between your organization and the engineering team. Our experienced AI engineers are responsible for implementation, integration with existing systems, and building technical solutions.
4

AI training courses

Explore the power of AI for every team in your organization. Our training courses are carefully designed to teach you how to effectively use AI to improve your business processes, automate tasks and strengthen your competitive position.

Stay in the AI loop

Join other leaders and stay up to date on the latest developments. Subscribe now and receive exclusive monthly emails full of valuable insights, updates and more.
300+
companies made frontrunner
3.500+
professionals trained
9+
average score
12+
years of experience