• தமிழில் RSS செய்தியோடை

    by  • January 24, 2004 • அறிவியல்/நுட்பம் • 0 Comments

    இந்த சுஜாதா-தமிழ்லினக்ஸ் விவகாரம் நிறையவே என்னுடைய நேரத்தையும் சக்தியையும் உறிஞ்சுகின்றது. இன்னும் அதில் எழுத வேண்டிய விஷயங்கள் நிறைய இருக்கின்றன. என்றாலும், அயர்வுதான் மிஞ்சுகிறது. கொஞ்சம் ஒத்திப் போட்டுவிட்டுப் பிற விஷயங்களைக் கவனிக்கலாம் என்று எண்ணம். நாளை காலை உள்ளூர் தொலைக்காட்சியில் என்னுடைய வழக்கமான அறிவியல் நிகழ்ச்சிக்காக செவ்வாய் கிரகத்தைப் பற்றிய சமீபத்திய கண்டுபிடிப்புகளை ஒளிப்பதிவு செய்ய வேண்டியிருக்கிறது. அளவுக்கு அதிகமாக வேலை குவிந்தால் என்ன ஆகும்?

    பல நாட்களாக நண்பர் தங்கமணியின் வலைப்பதிவுக்கு சென்று கருத்துகள் எழுதவேண்டும் என்று ஆசை (தங்கமணி மாத்திரமல்லர், இன்னும் சிலரும் என்னுடைய விருப்பப்பட்டியலில் இருக்கிறார்கள்). ஆனால் ஒத்திப் போட்டுக்கொண்டே வருகிறேன். இதற்கு முக்கியமான காரணம், யார் எப்பொழுது வலைப்பதிகிறார்கள் என்று தெரியாமல் போவதே. இதையெல்லாம் ஒழுங்கமைக்கத்தானே RSS செய்தியோடைத் தொழில்நுட்பம் இருக்கிறது. (இதன் தொழில்நுட்பத்தைப் பற்றி இன்னொரு நாள் விரிவாக). தமிழில் நாம் இன்னும் வலைக்குறிப்புகளின் அணைத்து சாத்தியங்களையும் முழுமையாகப் பயன்படுத்தவில்லை. இதோ என்னுடைய செய்தியோடைத் தொகுப்பில் முதல் முயற்சி. கொந்தர்கள் (Hackers) உலகில் ஒரு சொலவடை உண்டு, The best programmers are the laziest. ஏனென்றால் அவர்கள்தான் ஒரே செயலைத் திரும்பத் திரும்பச் செய்ய மறுப்பவர்கள். கணினி அதே சமாச்சாரத்தில் கில்லாடி. எனவே, வழமையான வேலைகளைக் கணினி பக்கம் திருப்புவதுதான் நல்லது. இதற்கு ஒரு நிரந்தர வழி செய்தாக வேண்டும். வழக்கம் போல திறந்த ஆணைமூல நிரலிதான் கைகொடுத்தது. இதன் பெயர் RSSFeedMagic என்பது. இது செய்தியோடை வசதி தருபவர்களின் ஓடைகளைத் திரட்டி ஒரே பக்கத்தில் கொடுக்கும். அதாவது நீங்கள் இரவு படுக்கைக்குப் போகுமுன் சமீபத்தில் நான் எழுதியிருக்கிறேனா, பத்ரி எழுதினாரா, காசி என்ன எழுதினார், தங்கமணியின் அடுத்த கவிதை எப்பொழுது, என்று ஒன்றொன்றாகப் போய்ப் பார்க்கத் தேவையில்லாமல் இவற்றின் சமீபத்திய இடுகைகளை எல்லாம் திரட்டி ஒன்றாக மேயும் வசதி.

    முயற்சி செய்து பாருங்கள்; http://www.tamillinux.org/venkat/rssfeedmagic/tamilblogs/

    என்னுடையது நேரடியாக யுனிகோடில் தெரிகிறது.ஆனால் நான் கட்டிவைத்த கட்டத்திற்குள் நிற்க மாட்டேன் என்கிறது. பதிரியின் ஓடை ஒழுங்காகப் பாய்கிறது, ஆனால் நீங்கள் யுனிகோடை உலாவியில் தெரிந்தெடுக்க வேண்டியிருக்கும். அடுத்ததாகக் காசியின் நியூக்ளியஸ் தரும் ஓடையைச் சேர்த்தேன். சரிவரவில்லை, பிறகு என்னுடைய வலைப்பக்கத்தின் ஓடை (வலைக்குறிப்பு அல்ல) அப்படியே. பிஹெச்பிவெப்சைட் என்னும் தொகுப்பின் அடிப்படையிலான அதுவும் நியூக்ளியஸ் போலவே பிஹெச் பியில் ஓடையத் தருகின்றது. இந்த பிஹெச்பி ஓடைகள் சரிவரவில்லை. பத்ரியின் ஓடையும், என்னுடைய ஓடையும் எக்ஸ்எம்எல் கொண்டவை. ஆனால், போல வலைப்பூக்கள் சஞ்சிகையின் ஓடையும் சரியில்லை.

    இன்னும் கொஞ்சம் நோண்டியதில் காசியின் ஓடை சரியாக வரவில்லை என்று தெரிகிறது (அதை யாராவது வேறு திரட்டியில் சரியாகப் படித்திருக்கிறீர்களா?).

    அவ்வளவுதான், ஹாவ்… தூக்கம் கண்களைத் தழுவுகின்றது.

    0 Responses to தமிழில் RSS செய்தியோடை

    1. காசி
      January 25, 2004 at 8:43 am

      வெங்கட்,

      இது மிகவும் தேவையான வசதி. இன்னும் வலைப்பதிவுகள் வர வர தேடுவதிலேயே நிறைய நேரம் வீணாகும்.

      1. bloglines.com போன்ற சேவைகளில் இருந்து இது எவ்வகையில் வேறுபட்டது (இன்னொருவரை நம்பி இருக்கவேண்டியதில்லை என்பதைத்தவிர)?

      2. இந்த முயற்சியில் எல்லா *உண்மையான* யுனிகோட் எழுத்துகளும் பூச்சிபூச்சியாய்த் தெரியக் காரணம் உலாவியில் குறியேற்ற முறை utf-8 ஆகத் தேர்வு செய்யாமல் இருப்பதுதான். உங்கள் rss திரட்டி, தான் html பொருளை அளிக்கும்போது சரியான charset=utf-8 அறிவிப்புடன் அளித்தும், உலாவி அதை புறந்தள்ளி உங்கள் வலைக்குறிப்பின் அறிவிப்பான charset=iso-8859-1 என்பதற்கே கீழ்ப்படிகிறது. உலாவியில் utf-8 குறியேற்றத்தைத் தேர்வு செய்ததும் உங்களோடு பத்ரியும் பளிச்சிட்டார்:-), இதை சோதித்தீர்களா?

      3. உங்கள் வலைக்குறிப்பின் குறியேற்றத்தை charset=iso-8859-1 என்று வைத்து இருந்தும் அதில் தமிழ் தெரிவதன் காரணம், எல்லா யுனிகோட் எழுத்துகளும் கனமான ‘& # 1234′ வடிவில் ஏழு பைட்டுகள் கொண்டு அமைக்கப்பட்டிருப்பதுதான். பத்ரியுடையதோ, என்னுடையதோ யுனிகோடின் இயற்கையான மூன்று பைட்டுகள் கொண்டு அமைக்கப்பட்டிருக்கின்றன. எனவே யுனிக்கோட் குறியேற்றத்தில் திரையெழுதும்போது மட்டும் சரியாகத் தெரியும். ஏழு பைட் வடிவம் எல்லா குறியேற்றத்திலும் தெரியும், ஆனால் யுனிகோடோடு ஒப்பிடும்போது இரு மடங்குக்கும் மேலாகவும், தஸ்கியோடு ஒப்பிடும்போது *எழு* மடங்கும் வீங்கிப்போவது தேவையற்றதுதானே. அதை ஏன் நீங்கள் மாற்றக் கூடாது?

      4. அதை மாற்றாவிட்டாலும்கூட, இப்போதைக்கு உங்கள் வலைக்குறிப்பின் குறியேற்ற முறையை charset=iso-8859-1க்குப்பதிலாக charset=utf-8 என்று அறிவிக்க முடியுமா? அப்படிச்செய்தால் rss திரட்டி சரியாக வேலை செய்யுமோ என்னவோ!

      5. என் வலைப்பதிவுகளில் கொடுத்துள்ள ‘rss ஓடை’ சுட்டியைத்தானே பயன்படுத்தினீர்கள்? எனக்கு bloglines.com மூலம் சரியாக வருகிறது. முகுந்தராஜும் அன்று ஒரு நாள் படம் மூலம் அவருக்கும் வேறு மென்கலத்தின்மூலம் திரட்டும்போது சரியாக வருவதாகச் சொல்லியிருந்தார்.

      முயற்சி செய்து மறுமொழியுங்கள்.

      அன்புடன்,

      -காசி

    2. Badri
      January 26, 2004 at 12:26 am

      நான் இப்பொழுதைக்கு, வெங்கட், என்னுடையது, காசி ஆகியோரின் RSS ஓடைகளை newsmonster மூலம் சேர்த்துப் படிக்கிறேன். சரியாக வருகிறது (அத்தனையுமே). கூடவே என்னுடைய வலைப்பதிவிற்கு வரும் பின்னூட்டங்களையும் படிக்கிறேன். (http://www.haloscan.com/members/rss.php?user=bseshadri)

      இதுவும் சரியாக வருகிறது. பிரபுவின் மணற்கேணி குத்துமதிப்பாக வருகிறது (எழுத்துகள் தெரிகின்றன, ஆனால் அவரது முன்பக்கம் சரியாக அமைக்கப்படவில்லையோ என்று எனக்குத் தோன்றுகிறது. எப்பொழுதும் ஒரேவொரு தலைப்பே கண்ணில் படுகிறது.) பரியின் வலைக்கிறுக்கல்கள் சரியாக வருகிறது, ஆனால். அதுவும் blogdriveஏ.

    3. Badri
      January 26, 2004 at 12:31 am

      அவசரப்பட்டுவிட்டேன். முதலில் blogdrive சரியாகத்தான் வந்துகொண்டிருந்தது. ஆனால் இப்பொழுது சரியில்லை. அதனால் பரியின் RSSஓடையும் குழப்பமாகவே வருகிறது. பிரபுவினுடையதைப் படிக்கவாவது முடிகிறது. [ஒரு தலைப்பு, பல செய்திச் சுருக்கங்கள்], பரியுனுடையதைப் படிக்க முடியாது ‘பூச்சி, பூச்சி’யாக வருகிறது. utf-8 இல்தான் இருக்கிறது என்றாலும் படிக்க முடியவில்லை.

    4. raviaa
      January 26, 2004 at 9:35 am

      (இதன் தொழில்நுட்பத்தைப் பற்றி இன்னொரு நாள் விரிவாக).

      எப்போ? எப்போ?

    5. venkat
      January 26, 2004 at 8:38 pm

      காசி, பத்ரி, நான் எழுதியிருந்‌ததுபோல இது முதல் முயற்சிதான். இன்னும் சரியாக நோண்டிப்பார்க்க வேண்டும்.

      இந்‌தப் பக்கங்களை நான் அமைக்க முயற்சிப்பதன் காரணங்கள்;

      1. ஒவ்வொருவரும் தனித்தனியாக திரட்டிகளை இணைத்துப், பக்கங்களைச் சேர்த்து வலைக்குறிப்புகளைக் கண்காணிக்க வேண்டியதில்லை.

      2. மாற்றான் கையை ந்ம்பாமல் தமிழ்ல் நாமே செய்துகொள்ளவேண்டும். அப்படிச் செய்தால்தான் நமக்கு வேண்டியபடி அமைத்துக் கொள்ள முடியும்.

      3. நாளைக்குக் கூடாரத்தையே காணும் என்ற அழுகை வராது.

      4. இதில் இருக்கும் நன்மை தீமைகளை ஆராய்ந்‌தால் தமிழில் வலைக்குறிப்புகளை ஒழுங்குபடுத்தலாம்.

    6. venkat
      January 26, 2004 at 8:46 pm

      காசி -என்னுடைய எம்டி பற்றிய உங்கள் கருத்துக்களுக்கு;

      நான் யுடிஎப்-8 போட்டலும் 8859-1 போட்டாலும் ஒரே மாதிரியாகத்தான் நடக்கிறது. முதலில் 8859-1 இல் இருந்தது, பின்னர் முதல்பக்கத்தைத் திருத்தியமைக்கும்பொழுது யுடிஎப்-8க்கு மாற்றினேன். பின்னர் ஒரு நாள் எம்டி குழப்பம் வந்து என்னுடைய முதல் பக்கத்தை இழக்க வேண்டியிருந்தது. அந்த சமயம், பழைய பக்கத்தைக் கிடங்கிலிருந்து திரும்பப் போட்டேன். (உங்கள் பக்கத்திற்கான இணைப்பு இப்பொழுது இல்லை பாருங்கள், திரும்பப் போட வேண்டும் அதே போல் மின்னஞ்சல் சந்தா பெட்டி பழையபடி வந்திருக்கிறது, தூக்க வேண்டும்). எனவேதான் நீங்கள் பார்த்த பொழுது 8859-1 ல் இருந்தது. இப்பொழுது யுடிஎப்-8க்கு மாற்றியும் எதுவும் மாறவில்லை.

      இது அடிப்படையில் எம்டி வேலை செய்யும் விதம் என்று நினைக்கிறேன். இல்லையென்றால் முதலிலிருந்து யுனிகோட் முறையில் ஆணைமூலத்திலிருந்து தொகுக்க வேண்டும் என்று நினைக்கிறேன். அது இந்த நிலையில் எனக்கு முடியாத காரியம். அடுத்த பெரிய எம்டி வெளியீடு வரும்பொழுது மாற்றிப்பார்ப்பேன்.

      மற்றபடி, நீங்கள் ஒரு இடத்தில் குமரகுருவின் பக்கங்கள் சிதைந்தற்கு எம்டியும் காரணமாக இருக்கலாம் என்று எழுதியிருந்ததாக நினைவு. எனக்குத் தெரிந்தவகையில் எம்டி மிகவும் உறுதியானது. அதிக உடைப்புகள் இல்லை.

    7. செல்வ&#299
      January 27, 2004 at 8:53 am

      வெங்கட்,

      நீங்கள் எப்போது encoding குறியீட்டை யுடிfக்கு மாற்றினீர்கள் என்று தெரியவில்லை. ஆனால், முன்பு Syndicate This Site (XML) என்கிற இணைப்பைச் சுட்டினால், XML அழகாக உங்கள் பக்கங்களைத் தமிழில் காட்டிக் கொண்டிருந்தது. என்னுடைய PHP முயற்சிகளுக்குக் கூட அதைத் தான் மாதிரியாகப் பயன்படுத்திக் கொண்டிருந்தேன். ஆனால், இப்போது அது சரியாக வேலை செய்யவில்லை. கீழ்வருமாறு அழுகிறது !

      An invalid character was found in text content. Error processing resource ‘http://www.tamillinux.org/venkat/myblog/index.rdf'. Line 46, Position 622

      சம&…

      அநேகமாய் ISO8859க்கு மாற்றினால் சரியாகி விடும் என்று தோன்றுகிறது. வேறு இன்னும் சரியான திருத்தங்களும் இருக்கக் கூடும். இன்னும் கொஞ்சம் நோண்டிப் பார்க்க வேண்டும்.

    8. காசி
      January 27, 2004 at 1:11 pm

      வெங்கட்,

      இந்த யுனிகோடினால் பல நல்லது நடந்தாலும், சில தொல்லைகளும் இல்லாமல் இல்லை. நியூக்ளியஸ்ஸின் தமிழ்வடிவம் முதலில் நினைத்தது போல அவ்வளவு எளிதாய் இல்லை. ~650 கட்டளைச் சொற்றொடர்கள் கொண்ட மொழிக் கோப்பை தமிழில் கொண்டுவந்தபிறகும் பாதி கூட தமிழுக்கு மாறவில்லை. பிறகு நிறைய இடங்களில் கழுத்துக்குக் கத்திவைத்து சிதைத்த பின்னரே ஓரளவுக்கு வசப்பட்டது. அடுத்து பதிப்பு வந்தால் எப்படி இதையெல்லாம் அதில் கொண்டுவருவது என்பது சிரமமான வேலைதான். அதே போலத்தான் எம்டியிலும் நீங்கள் நிறைய கைவைக்க வேண்டியிருக்கும் என்று நினைக்கிறேன்.

      அன்று நான் குமரகுருவின் பக்கங்கள் சிதைந்ததைப் பற்றி எழுதும்போது எம்டியும் காரணமாக இருக்கலாம் என்று எழுதவில்லை. நியூகளியஸ்ஸைக் காட்டிலும் எம்டி கட்டாயம் பாதுகாப்பானது என்றுதான் நினைக்கிறேன். ஆனால் அந்தப் பாதுகாப்பையும் உடைத்து விட்டார்களோ என்று தான் ஐயம் தெரிவித்தேன். எதையும் உடைக்க ஆள்கள் இருக்கிறார்களே, இதெல்லாம் தேவையின் ஆழத்தைப் பொறுத்தது என்று நினைக்கிறேன்.

      அதே போலத்தான் தண்டர்பேர்ட்-ல் அஞ்சல்களைப் பிரித்து தலைப்பு வாரியாகத் தொகுக்க ஒரு கட்டளை இட்டபோது, அது யுனிகோட் தமிழில் தொகுப்பின் தலைப்பு இருந்தால் வேலை செய்ய மறுக்கிறது. அதையும் தமிழ்ப்படுத்தும்போது, யுனிகோடுடன் ஒத்தியங்க ஒரு மாற்றம், தமிழ் மொழிக்காக இன்னொரு மாற்றம் என்று இரு நிலைகளில் செய்யவேண்டியிருக்கும். இதில் முதல் நிலை CJK மொழியினர் உள்ளிட்ட பலருக்கு பொதுவானது. எனவே அங்கிருந்து ஆரம்பித்தால் எளிது. என் தனி மடல் கிடைத்ததா?

      அன்புடன்,

      -காசி

    Leave a Reply

    Your email address will not be published. Required fields are marked *