...آموزش زبان برنامه نویسی پایتون از مقدماتی تا پیشرفته به زبان خودمونی

۴ مطلب با موضوع «انواع داده ها :: رشته ها» ثبت شده است

دسته بندی متن در پایتون

سلام وقتتون بخیر ...
ببخشید من کدی برای دستهبندی متن زدم منتها یک اروری بهم میده! برای component هر مقداری قرار میدم با این ارور مواجه میشم لطفا راهنماییم کنید با تشکر
کد:
import sklearn
from sklearn import datasets
from sklearn.decomposition import TruncatedSVD
from sklearn.preprocessing import Normalizer
from sklearn.pipeline import make_pipeline
from sklearn.random_projection import sparse_random_matrix
print("linear svm")
data_train =sklearn.datasets.load_files('F:/arshad/out put1', description=None, categories=None, load_content=True, shuffle=True, encoding='utf-8', decode_error='strict', random_state=0)
data_test = sklearn.datasets.load_files('C:/Users/parya/Desktop/data/100-1/test', description=None, categories=None, load_content=True, shuffle=True, encoding='utf-8', decode_error='strict', random_state=0)
categories = data_train.target_names
y_train, y_test = data_train.target, data_test.target
import codecs
file = codecs.open('F:/s.txt','r','utf-8')
stopwords = file.read().split('\n')
from sklearn.feature_extraction.text import TfidfVectorizer
vectorizer = TfidfVectorizer(sublinear_tf=True,max_df = 0.5 ,stop_words=stopwords)
X_train = vectorizer.fit_transform(data_train.data)
X_train

svd = TruncatedSVD(n_components=380, algorithm='randomized', n_iter=100, random_state=None, tol=0.0)
normalizer = Normalizer(copy=False)
lsa = make_pipeline(svd, normalizer)
X = lsa.fit_transform(X_train)
from sklearn.svm import LinearSVC
LinearSVC(loss='l2', penalty='l2', dual=False, tol=1e-3)
clf = LinearSVC().fit(X, y_train)
X_test = vectorizer.transform(data_test.data)
predicted = clf.predict(X_test)
import numpy as np
print(np.mean(predicted == y_test))
from sklearn import metrics
print(metrics.classification_report(y_test, predicted,target_names=data_test.target_names))
metrics.confusion_matrix(y_test, predicted)


ارور برنامه:
ValueError: X has 2430 features per sample; expecting 150

۰ نظر موافقین ۰ مخالفین ۰
حمید حق دوست

کار با رشته ها در پایتون

برنامه ای بنویسید که دو رشته را از کاربر دریافت کرده، سپس همه زیررشته های مشترک آن ها را که در هر دو رشته از
مکان یکسانی آغاز می شود و شروع هیچ یک از درون دیگری نیست را به صورت مرتب شده چاپ کند. همچنین باید طول
بزرگ ترین این زیررشته ها در انتها چاپ شود. فرض کنید رشته ها دارای کاراکتر خالی نیستند

                       مثلا  ورودی
" abcdefilfhijkl"
" abcedfikfhijk"

abc
fhijk
fi

دوستان من خیلی وقته دیگه پایتون کار نمیکنم و این وبلاگ واسه چند سال پیشه که همچنان سوال مطرح میشه... لطفا اگه میدونید جواب بدید
۰ نظر موافقین ۰ مخالفین ۰
حمید حق دوست

برنامه ساده با پایتون برای پردازش طول رشته

سلام من یه برنامه با زبان پایتون میخواستم بنویسم که با گرفتن عدد ورودی ،به همون تعداد رشته از کاربر گرفته بشه.سپس طول رشته ای که تفائت ارقام درش زیاد هست چاپ بشه.رشته ها باید حتما کوچیک و طولشون از 20 کمتر باشه.اعداد تکراری شمرده نشه


کسی میتونه جوابشو بده؟

۰ نظر موافقین ۰ مخالفین ۰
حمید حق دوست

رشته ها در پایتون

رشته چیست؟

رشته(string) یکی از انواع داده ها در پایتون است و مجموعه ای از کاراکتر هاست که در کنار هم می آیند و طول آن میتواند یک یا بیشتر از یک باشد. مثلا هر یک از موارد زیر مثالی از رشته در پایتون هستند:

“ Hello,  how  are  you? ” 

“ 1+1 ” 

“ I  ate  4  bananas ” 

“ !@#$%^ & *() ”

رشته ها در هر زبانی کارایی بسیاری دارند و با عملیاتی که روی رشته ها انجام میدهیم بسیاری از مسئله ها رو میتونیم حل کنیم و در عمل نیاز شدیدی به توانایی کار با رشته ها داریم.

شما در کار با رشته ها به طور مکرر با کوتیشن مواجه خواهید شد که بسته به نوع کارتان میتواند دبل کوتیشن(") یا تک کوتیشن(') باشد.

برای شروع بیایید کمی با رشته ها کار کنیم...


python3.3.3 shell رو اجرا کنید و بعد از تایپ عبارتهای مشکی زیر اینتر رو بزنید:

 “This is a string using a double quote”

‘This is a string using a double quote’


 ‘This is a string with a single quote’

‘This is a string with a single quote’


This string has three quotes “””

”””look at what it can do

‘This string has three quotes\nlook at what it can do’

میبینید که خروجی ها تنها با یک کوتیشن نمایش داده میشوند...


 

۰ نظر موافقین ۱ مخالفین ۰
حمید حق دوست