Agents

hf-cookbooknotebookstr

Transformers Agents kullanarak, tool-calling süper güçleriyle donatılmış bir ajan oluşturun 🦸

Yazar: Aymeric Roucher Çeviren: Alper Erdoğan

Bu notebook, harika ajanlar oluşturmak için Transformers Agents'ı nasıl kullanabileceğinizi gösterir!

Ajanlar nedir? Ajanlar, bir LLM tarafından desteklenen ve spesifik istemler ile çıktıların ayrıştırılması sayesinde belirli araçları kullanarak problemleri çözebilen sistemlerdir.

Bu araçlar basitçe LLM'nin kendi başına iyi performans sergileyemediği işlevleri kapsar: örneğin Llama-3-70B gibi metin üreten bir LLM için görüntü oluşturma aracı, web arama aracı veya hesap makinesi olabilir...

Transformers Agents nedir? Kendi ajanlarınızı oluşturmak için yapı taşları sağlayan transformers kütüphanemizin bir uzantısıdır! Dökümantasyondan daha fazla bilgi edinin.

Nasıl kullanılacağına ve hangi kullanım senaryolarını çözebileceğine bakalım.

Gerekli kütüphaneleri yüklemek için aşağıdaki satırı çalıştırın:

[26]

1. 🏞️ Çok Modlu + 🌐 Web tarayıcı asistanı

Bu kullanım senaryosu için, internette gezinen ve görsel oluşturabilen bir ajan göstermek istiyoruz.

Bunu oluşturmak için basitçe iki aracın hazır olması gerekiyor: görüntü oluşturma ve internet üzerinden arama.

  • Görsel oluşturmak için, Stable Diffusion kullanarak görseller oluşturmak üzere Hub'dan HF Inference API'yi (Serverless) kullanan bir araç yüklüyoruz.
  • İnternette arama yapmak için yerleşik bir araç kullanıyoruz.
[ ]

Image of an Aston Martin DB5

2. 📚💬 RAG ile yinelemeli sorgu iyileştirme ve kaynak seçimi

Kısa tanım: Retrieval-Augmented-Generation (RAG), “bir kullanıcı sorgusunu yanıtlamak için bir büyük dil modeli (LLM) kullanır, ancak yanıtı veri setinden elde edilen verilere dayandırır”.

Bu yöntemin yalın ya da fine-tuned bir LLM kullanımına göre birçok avantajı vardır: bunlardan birkaçını saymak gerekirse, cevabı doğru gerçeklere dayandırmaya ve karışıklıkları azaltmaya izin verir, LLM'e özgü bilgileri sağlamaya ve bilgi tabanından veriye erişimin ince taneli kontrolüne izin verir.

  • Şöyle bir senaryo düşünelim. RAG yöntemini uygulamak istiyoruz, ancak bazı parametrelerin dinamik olarak belirlenmesi gereken ek bir koşulumuz var. Örneğin, kullanıcı sorgusuna bağlı olarak aramayı bilgi tabanının belirli alt kümeleriyle sınırlamak isteyebiliriz veya alınan belge sayısını ayarlamak isteyebiliriz. Peki, bu parametreleri kullanıcı sorgusuna göre nasıl dinamik olarak ayarlayabiliriz?

  • RAG'de sık karşılaşılan bir sorun, kullanıcı sorgusuna verilen cevabın hangi belgeden geldiğinin bulunmamasıdır. Eğer önceki sonuçlar alakalı değilse, retriever'ı değiştirilmiş bir sorgu ile tekrar çalıştırarak sonuç alma şansımız var mı?

🔧 Yukarıdaki noktaları basit bir şekilde çözebiliriz: ajanımıza retriever'ın parametrelerinin kontrolünü vereceğiz!

➡️ Hadi bunu nasıl yapacağımızı gösterelim. İlk olarak üzerinde RAG uygulamak istediğimiz bir bilgi tabanını yüklüyoruz: bu veri seti, markdown olarak depolanan birçok Hugging Face kütüphanesinin dokümantasyon sayfalarının bir derlemesidir.

[ ]

Şimdi veri setini işleyerek ve retriever tarafından kullanılacak bir vektör veritabanına depolayarak bilgi tabanını hazırlıyoruz. Vektör veritabanları için mükemmel yardımcı programlara sahip olduğu için LangChain'i kullanacağız:

[4]
/var/folders/6m/9b1tts6d5w960j80wbw9tx3m0000gn/T/ipykernel_16932/1458839689.py:15: LangChainDeprecationWarning: The class `HuggingFaceEmbeddings` was deprecated in LangChain 0.2.2 and will be removed in 1.0. An updated version of the class exists in the :class:`~langchain-huggingface package and should be used instead. To use it run `pip install -U :class:`~langchain-huggingface` and import as `from :class:`~langchain_huggingface import HuggingFaceEmbeddings``.
  embedding_model = HuggingFaceEmbeddings(model_name="thenlper/gte-small")

Artık veritabanımız hazır olduğuna göre, kullanıcı sorgularını buna göre yanıtlayan bir RAG sistemi oluşturalım!

Sistemimizin sorguya bağlı olarak yalnızca en alakalı bilgi kaynaklarından seçim yapmasını istiyoruz.

Dökümantasyon sayfalarımız aşağıdaki kaynaklardan gelecek:

[5]
['datasets-server', 'datasets', 'optimum', 'gradio', 'blog', 'course', 'hub-docs', 'pytorch-image-models', 'peft', 'evaluate', 'diffusers', 'hf-endpoints-documentation', 'deep-rl-class', 'transformers']

👉 Şimdi ajanlarımızın bilgi tabanından bilgi almak için kullanabileceği bir RetrieverTool oluşturalım.

Vectordb'yi aracın bir özelliği olarak eklememiz gerektiği için, basit araç oluşturusunu ve @tool dekoratörünü kullanmak yeterli olmayacak. Bu nedenle, gelişmiş ajanlar dökümantasyonunda belirtilen gelişmiş yapılandırmayı takip edeceğiz

[13]

Opsiyonel: Retriever aracınızı Hub'da paylaşın

Aracınızı Hub'da paylaşmak için, önce RetrieverTool tanım hücresindeki kodu kopyalayıp, örneğin retriever.py gibi bir adla yeni bir dosyaya yapıştırın.

Araç ayrı bir dosyadan yüklendiğinde, aşağıdaki kodu kullanarak Hub'a gönderebilirsiniz (yazma yetkisine sahip bir token ile giriş yaptığınızdan emin olun).

[ ]

Ajanı çalıştırın!

[ ]

Peki burada ne oldu? İlk olarak, ajan belirli kaynaklarla (['transformers', 'blog']) birlikte retriever'ı başlattı.

Ancak bu arama yeterli sonucu vermedi. Sorun değil! Ajan, önceki sonuçlar üzerinde tekrar çalışabildiği için, daha az kısıtlayıcı arama parametreleriyle yeniden sorgulama yaptı ve sonuç olarak araştırma başarılı oldu!

Bir LLM ajanının bir retriever aracını kullanarak dinamik olarak sorguyu ve retrieval parametrelerini değiştirebilmesi, RAG'in daha genel bir formülasyonunu oluşturur ve aynı zamanda yinelemeli sorgu iyileştirme gibi birçok RAG geliştirme tekniğini de kapsar.

Bir retriever'ı araç olarak kullanıp, sorguyu ve diğer veri çekme parametrelerini dinamik olarak değiştirebilen bir LLM ajanı kullanmak, yinelemeli sorgu iyileştirmesi gibi birçok RAG geliştirme tekniğini de kapsayan RAG'in daha genel bir formülasyonudur.

3. 💻 Python Kodunda Hata Ayıklama

ReactCodeAgent'in yerleşik bir Python kod yorumlayıcısı olduğundan, hatalı Python scriptimizi debug etmek için kullanabiliriz!

[20]
======== New task ========
I have some code that creates a bug: please debug it, then run it to make sure it works and return the final code
You have been provided with these initial arguments: {'code': '\nlist=[0, 1, 2]\n\nfor i in range(4):\n    print(list(i))\n'}.
=== Agent thoughts:
Thought: The provided code has a bug. The `list` is a built-in type in Python and should not be used as a variable name. Furthermore, the `list` type does not have a `__call__` method, which means that you cannot use parentheses to access its elements. Instead, square brackets should be used to index the list. I will correct the variable name and the indexing syntax and then run the code to ensure it works.
>>> Agent is executing the code below:
my_list = [0, 1, 2]

for i in range(4):
    if i < len(my_list):
        print(my_list[i])
    else:
        print("Index out of range")
====
Print outputs:
0
1
2
Index out of range

=== Agent thoughts:
Thought: The code has been corrected and is running as expected, printing the list items for valid indices and an out-of-range message for invalid indices. I will return the final corrected code as the answer.
>>> Agent is executing the code below:
final_answer(answer='''my_list = [0, 1, 2]

for i in range(4):
    if i < len(my_list):
        print(my_list[i])
    else:
        print("Index out of range")''')
====
Print outputs:

Last output from code snippet:
my_list = [0, 1, 2]

for i in range(4):
    if i < len(my_list):
        print(my_list[i])
    else:
        print("Index out of range")
Final answer:
my_list = [0, 1, 2]

for i in range(4):
    if i < len(my_list):
        print(my_list[i])
    else:
        print("Index out of range")

Gördüğünüz gibi, ajan verilen kodu deniyor, bir hata alıyor, hatayı analiz ediyor, kodu düzeltiyor ve çalıştığını gördükten sonra geri veriyor!

Sonuç olarak düzeltilen kodun son hali:

[21]
my_list = [0, 1, 2]

for i in range(4):
    if i < len(my_list):
        print(my_list[i])
    else:
        print("Index out of range")

4. Kendi LLM motorunuzu oluşturun (OpenAI)

Kendi LLM motorunuzu oluşturmak gerçekten çok kolay: sadece bu kriterlere sahip bir __call__ yöntemine ihtiyaç duyar:

  1. Girdi olarak ChatML formatında bir mesaj listesi alır ve cevabı çıktı olarak verir.
  2. stop_sequences argümanını destekleyerek metin üretmeyi durduracak dizileri tanımlar.
  3. LLM'inizin desteklediği mesaj rolü (asistan, kullanıcı vb.) türlerine göre bazı mesaj rollerini dönüştürmeniz gerekebilir.
[6]
======== New task ========
I have some code that creates a bug: please debug it and return the final code
You have been provided with these initial arguments: {'code': '\nlist=[0, 1, 2]\n\nfor i in range(4):\n    print(list(i))\n'}.
==== Agent is executing the code below:
my_list = [0, 1, 2]  # Renamed the list to avoid using the built-in name

for i in range(len(my_list)):  # Changed the range to be within the length of the list
    print(my_list[i])  # Corrected the list access syntax
====
Print outputs:
0
1
2

==== Agent is executing the code below:
my_list = [0, 1, 2]  # Renamed the list to avoid using the built-in name

for i in range(len(my_list)):  # Changed the range to be within the length of the list
    print(my_list[i])  # Corrected the list access syntax
====
Print outputs:
0
1
2

==== Agent is executing the code below:
corrected_code = '''
my_list = [0, 1, 2]  # Renamed the list to avoid using the built-in name

for i in range(len(my_list)):  # Changed the range to be within the length of the list
    print(my_list[i])  # Corrected the list access syntax
'''

final_answer(answer=corrected_code)
====
Print outputs:

>>> Final answer:

my_list = [0, 1, 2]  # Renamed the list to avoid using the built-in name

for i in range(len(my_list)):  # Changed the range to be within the length of the list
    print(my_list[i])  # Corrected the list access syntax

[7]

my_list = [0, 1, 2]  # Renamed the list to avoid using the built-in name

for i in range(len(my_list)):  # Changed the range to be within the length of the list
    print(my_list[i])  # Corrected the list access syntax

➡️ Son olarak

Yukarıdaki kullanım örnekleri, Agents'ın sunduğu olanaklar hakkında size bir fikir verecektir.

Daha gelişmiş kullanım için dökümantasyonu ve Llama-3-70B'yi temel alan ve son derece zorlayıcı GAIA Liderlik Tablosunda birçok GPT-4 ajanlarını geride bırakan kendi ajanımızı oluşturmamızı sağlayan bu deneyi okuyun!

Tüm geri bildirimleri bekliyoruz, Agents'ı geliştirmemize yardımcı olacak!